Gene Cag_0221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0221
Symbol
ID	3747809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	250060
End bp	251286
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	44%
IMG OID	637772748
Product	anion-transporting ATPase
Protein accession	YP_378542
Protein GI	78188204
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATTT TAACTTTTAC GGGTAAAGGC GGAGTAGGTA AAACCAGTGT TTCAGCCGCA 
ACGGCTGTCC GATTATCACA ACTTGGCTAC AGAACCCTCG TGCTTTCCAC TGACCCTGCC 
CACAGCTTAT CAGACTCTTA CAATCTCCCG CTTGGCGCTG AACCAACCAA AATTAAGGAT 
AACCTCGATG CCATTGAGGT AAATCCTTAC GTTGACCTCA AGCAAAATTG GCACTCCGTC 
CAAAAGTACT ACACCAAAGT CTTTATGGCG CAAGGCGTTT CGGGGGTTAT GGCTGATGAA 
ATGACCATTT TGCCCGGCAT GGAAGAACTT TTTTCGCTCT TACGTATTAA GCGTTACAAA 
ACAAGCGGCA AATACGATGT GCTTGTGCTC GATACAGCCC CTACGGGCGA AACCCTTCGC 
CTCCTCTCCC TACCCGACAC TCTGTCGTGG GGTATGAAAG CTGTAAAAAA TGTCAATAAA 
TATATTATTC GTCCGCTCAG CAAGCCGCTC TCAAAAATGT CGGATAAAAT TGCTGACTTT 
ATTCCCCCAA CTGATGCAAT AGACTCGGTG GATCAAGTTT TTGAGGAACT TGAAGATATC 
CGCAACATTT TAACTGACAC AAAAAAATCC ACCGTCCGCT TGGTGATGAA CGCTGAAAAA 
ATGTCTATTA AAGAGACAAT GCGTGCCCTC ACCTATCTCA ATCTTTACGG CTTTAATGTG 
GATATGGTGT TAGTAAATCG CTTGCTCGAC ACCCAAGAAA ATAGTGGCTA CTTGGAAAAC 
TGGAAAGCTA TACAGCAAAA ATATTTAGGC GAAATTGAAG AAGGCTTTGC TCCGCTTCCT 
GTTAAAAAGC TGAAAATGTA TGATCAGGAA ATTGTTGGGC TAAAATCTCT TGAAGTGTTT 
GCGCACGACA TGTATGGCGA AAGCGACCCA TCGGTTACCA TGCACGATGA ACTGCCCATT 
AAATTTGTAC GTCGCGAAAA TGTGTATGAA GTGCAGCTCA AGCTCATGTT TGTTAATCCC 
GTTGATATTG ATATTTGGGT TACGGGCGAT GAGCTGTTTG TTCAAATTGG TAACCAGCGC 
AAAATTATTA CGTTACCATT AAGCTTAACA GGACTTGAAC CAGGTGAAGC TATCTTTAAA 
GACAAATGGC TGCACATTCC ATTTGACCTC GACAAGAATA ACCATACACG CTCCCAACAA 
GAGCAGCAAG CCGCATCACG AAGATAA

Protein sequence

MRILTFTGKG GVGKTSVSAA TAVRLSQLGY RTLVLSTDPA HSLSDSYNLP LGAEPTKIKD 
NLDAIEVNPY VDLKQNWHSV QKYYTKVFMA QGVSGVMADE MTILPGMEEL FSLLRIKRYK 
TSGKYDVLVL DTAPTGETLR LLSLPDTLSW GMKAVKNVNK YIIRPLSKPL SKMSDKIADF 
IPPTDAIDSV DQVFEELEDI RNILTDTKKS TVRLVMNAEK MSIKETMRAL TYLNLYGFNV 
DMVLVNRLLD TQENSGYLEN WKAIQQKYLG EIEEGFAPLP VKKLKMYDQE IVGLKSLEVF 
AHDMYGESDP SVTMHDELPI KFVRRENVYE VQLKLMFVNP VDIDIWVTGD ELFVQIGNQR 
KIITLPLSLT GLEPGEAIFK DKWLHIPFDL DKNNHTRSQQ EQQAASRR