Gene Cag_2014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_2014
Symbol
ID	3747987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2554198
End bp	2555586
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	47%
IMG OID	637774551
Product	F0F1 ATP synthase subunit beta
Protein accession	YP_380305
Protein GI	78189967
COG category	[C] Energy production and conversion
COG ID	[COG0055] F0F1-type ATP synthase, beta subunit
TIGRFAM ID	[TIGR01039] ATP synthase, F1 beta subunit

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGAAG GCAAGATTTC ACAAATCATC GGGCCCGTCG TTGATGTTGA TTTCCCTGAA 
GGACGGTTGC CATCAATTCT TGATGCGCTT ACTGTTAAAA GAGAAGATGG CTCTAAGTTG 
GTGCTTGAAA CCCAACAGCA CCTTGGTGAA GAGCGTGTTC GTACCGTTGC TATGGAAAGC 
ACCGATGGTT TAGTAAGAGG CATGGGCGTG GTGAATACCG GCGCTGCTAT TCAGGTGCCT 
GTTGGCGCTG AAGTGCTTGG ACGCATGTTA AACGTTGTGG GCGATCCAAT TGATGGACGC 
GGTCCCGTTA ACAGCAAAAA AACCTACTCC ATCCATCGTA GTGCTCCAAA GTTTGAAGAC 
ATTTCAACCA AAGCTGAAAT GTTTGAAACG GGTATTAAAG TTATTGACTT ACTTGAACCA 
TACTCTCGCG GTGGAAAAAC CGGTTTGTTT GGTGGTGCAG GTGTAGGCAA AACCGTGCTC 
ATTATGGAGC TGATTAACAA CATTGCAAAG CAGCAGTCGG GCTTTAGCGT GTTTGCGGGC 
GTAGGTGAGC GTACTCGCGA AGGTAACGAC CTTTGGCACG AAATGATGGA GTCGGGCGTT 
ATTGACAAAA CCGCACTTGT GTTTGGTCAA ATGAACGAAC CTCCCGGTGC TCGTCAGCGT 
GTGGCTTTAA CGGGTTTGAG TATTGCAGAA TACTTCCGTG ATGAAGAAAA TCGCGATGTG 
TTGCTCTTTG TTGACAACAT TTTCCGCTTT ACGCAGGCAG GTTCAGAGGT ATCGGCACTG 
CTTGGACGTA TGCCAAGTGC TGTAGGTTAC CAGCCAACGC TTGCAACCGA AATGGGTCAG 
CTTCAAGATA GAATTGTTTC CACCAAAAAA GGTTCGGTTA CCTCAGTACA AGCTATTTAT 
GTGCCTGCTG ATGACCTTAC CGACCCTGCT CCTGCAACAG CGTTTACCCA CTTGGATGCA 
ACCACAGTGC TTTCACGTTC CATTGCAGAG CTTGGTATTT ATCCTGCGGT AGATCCACTT 
GACTCCACTT CCCGTATTCT TGATCCTAAT GTTGTTGGCG ACGACCACTA CAACACCGCA 
CAAGCGGTAA AGCAGTTGCT CCAGCGCTAT AAAGATTTGC AAGATATTAT TGCAATTCTT 
GGTATGGACG AGTTAAGCGA TGAAGATAAG TTGGTGGTAT CGCGCGCACG TAAAGTACAG 
CGCTTCCTTT CACAGCCATT CTTTGTGGCT GAAGCCTTTA CGGGTCTTGC TGGTAAGTAT 
GTAAAGCTTG AAGATACTAT CAAAGGCTTT AAAGAAATTA TTGCTGGAAA GCACGATAAA 
CTCCCAGAAA ATGCCTTCTA CCTTGTAGGC ACCATTGAAG AGGCTATCGA GAAAGCAAAA 
ACTCTCTAA

Protein sequence

MQEGKISQII GPVVDVDFPE GRLPSILDAL TVKREDGSKL VLETQQHLGE ERVRTVAMES 
TDGLVRGMGV VNTGAAIQVP VGAEVLGRML NVVGDPIDGR GPVNSKKTYS IHRSAPKFED 
ISTKAEMFET GIKVIDLLEP YSRGGKTGLF GGAGVGKTVL IMELINNIAK QQSGFSVFAG 
VGERTREGND LWHEMMESGV IDKTALVFGQ MNEPPGARQR VALTGLSIAE YFRDEENRDV 
LLFVDNIFRF TQAGSEVSAL LGRMPSAVGY QPTLATEMGQ LQDRIVSTKK GSVTSVQAIY 
VPADDLTDPA PATAFTHLDA TTVLSRSIAE LGIYPAVDPL DSTSRILDPN VVGDDHYNTA 
QAVKQLLQRY KDLQDIIAIL GMDELSDEDK LVVSRARKVQ RFLSQPFFVA EAFTGLAGKY 
VKLEDTIKGF KEIIAGKHDK LPENAFYLVG TIEEAIEKAK TL