Gene Cag_0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0140
Symbol
ID	3747186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	154291
End bp	155871
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	44%
IMG OID	637772667
Product	F0F1 ATP synthase subunit alpha
Protein accession	YP_378461
Protein GI	78188123
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTACAA CAGTCAGGCC TGATGAGGTT TCATCCATAC TTCGCAAACA GCTTGCCAAT 
TTTGAGTCAG AAGCTGACGT ATATGATGTT GGAACAGTGC TCCAGGTTGG TGACGGTATC 
GCCCGTGTGT ATGGGTTGAC AAAAGTCGCA GCCGGTGAGC TTCTTGAATT TCCAAACAAT 
GTAATGGGCA TGGCGCTTAA CCTCGAAGAG GATAACGTTG GTGCAGTGTT GTTTGGTGAA 
TCCACCATGG TGAAGGAGGG TGATACTGTA AAGCGTTCAG GTATTTTGGC TTCTATTCCG 
GTTGGTGAAG CTATGTTAGG TCGCGTTATC AATCCACTTG GTGAGCCAAT TGATGGTAAA 
GGGCCTATTG ATGCTAAACT TCGTTTACCA CTTGAGCGTC GTGCTCCTGG TGTTATTTAT 
CGTAAATCAG TACATGAGCC ACTGCAAACA GGCTTAAAAG CTATTGATGC TATGATTCCT 
GTTGGTCGTG GTCAGCGTGA GTTGATTATT GGTGACCGTC AAACAGGTAA AACCGCTGTA 
GCGCTTGATA CCATTATCAA CCAGAAAGGT AAAGGCGTTT TTTGTATTTA CGTTGCTATC 
GGTTTAAAAG GTTCAACGAT TGCGCAGGTT GTAAGTACGC TTGAAAAATA TGATGCGCTT 
TCTTACACCA CTGTTATTGC TGCTACAGCT TCCGATCCTG CTCCACTTCA GTTTATTGCT 
CCATTTGCAG GCGCTACGCT TGGTGAGTAT TTCCGCGATA CTGGTCGCCA TGCGCTTGTT 
ATATATGATG ATCTTTCAAA GCAGGCTGTT TCTTATCGTC AGGTTTCGCT CTTGCTTCGT 
CGTCCACCAG GACGTGAAGC TTACCCTGGT GATGTGTTCT ACTTACACTC TCGTTTGCTT 
GAGCGTGCTG CAAAAATTAC CGATGATGTT GAAGTCGCTA AAAAAATGAA CGACCTTCCT 
GATGCCTTAA AGCCATTGGT GAAGGGTGGA GGTAGCTTAA CGGCATTGCC TATTATTGAA 
ACACAGGCAG GTGACGTGTC GGCATACATT CCAACAAACG TTATTTCTAT TACTGACGGT 
CAAATCTTCC TTGAGTCAAA CCTCTTTAAC TCAGGTCAGC GTCCTGCTAT TAACGTTGGT 
ATTTCGGTAT CGCGTGTAGG TGGTGCAGCG CAAATTAAAG CAATGAAGAA AATTGCTGGT 
ACGCTTCGCC TTGATTTGGC TCAGTTCCGC GAACTTGAAG CCTTCTCTAA ATTTGGTTCT 
GACCTTGATA AAACAACCAA AGCGCAGCTT GATCGTGGCG CTCGCCTTGT TGAAATTTTA 
AAGCAAGGGC AGTATGTGCC AATGCCCGTT GAAAAACAGG TGGCAATTAT TTTTGTAGGT 
ACGCAAGGAT TGCTTGATTC CGTTGACTTG AAATTTATCC GCAAGTGTGA GGAAGAGTTC 
CTTGCAATGC TTGAAATGAA GCATGCAGAT ATTCTTAGTG GAATTGCCGA GAAAGGGACG 
CTTGAAGCTG ATGTAGCAAG CAAGTTGAAA GATATTGCAA CCAAGTTTAT TGCTACATTT 
AAAGAGAAAA ACAAAGCCTA A

Protein sequence

MSTTVRPDEV SSILRKQLAN FESEADVYDV GTVLQVGDGI ARVYGLTKVA AGELLEFPNN 
VMGMALNLEE DNVGAVLFGE STMVKEGDTV KRSGILASIP VGEAMLGRVI NPLGEPIDGK 
GPIDAKLRLP LERRAPGVIY RKSVHEPLQT GLKAIDAMIP VGRGQRELII GDRQTGKTAV 
ALDTIINQKG KGVFCIYVAI GLKGSTIAQV VSTLEKYDAL SYTTVIAATA SDPAPLQFIA 
PFAGATLGEY FRDTGRHALV IYDDLSKQAV SYRQVSLLLR RPPGREAYPG DVFYLHSRLL 
ERAAKITDDV EVAKKMNDLP DALKPLVKGG GSLTALPIIE TQAGDVSAYI PTNVISITDG 
QIFLESNLFN SGQRPAINVG ISVSRVGGAA QIKAMKKIAG TLRLDLAQFR ELEAFSKFGS 
DLDKTTKAQL DRGARLVEIL KQGQYVPMPV EKQVAIIFVG TQGLLDSVDL KFIRKCEEEF 
LAMLEMKHAD ILSGIAEKGT LEADVASKLK DIATKFIATF KEKNKA