Gene Cag_1237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1237
Symbol
ID	3748270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1643795
End bp	1644805
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	52%
IMG OID	637773770
Product	arginine/ornithine transport system ATPase
Protein accession	YP_379541
Protein GI	78189203
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1703] Putative periplasmic protein kinase ArgK and related GTPases of G3E family
TIGRFAM ID	[TIGR00750] LAO/AO transport system ATPase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCACC ACCATACATT TGATGTAGAA GCCATAGCCA ATGCCATTAT GCAAGGCAAT 
CGCCACCAGC TTAGTCGAGC AATTACGTTG GTGGAGTCGC AACGCATAGA GCACCACCAT 
GTAGCTGAAG CTATTCTTGA GCGTTGTATG GCAAGCAATC GCCATGCGCT ACGTATTGGT 
ATTACGGGTT CGCCCGGTGC GGGCAAAAGC ACCTTTATTG AGGCTTTTGG CGAACATATT 
CTTTCGCAAG GATTAAGGCT TGCGGTGCTG GCAATTGACC CAAGTAGCCA CCATTCCAAA 
GGAAGTATTC TTGGCGATAA AGCACGAATG GAAAAGCTTT CGGGACGAAA AGAGGCGTTT 
ATTCGTCCAA CGCCTTCATC GGGGCATCTT GGCGGCACTT CACCCCGAAC GCACGAGGCG 
CTATTGCTGT GCGAGGCGGC TGGTTATGAC GTAATAATTG TGGAGACGGT GGGTGTTGGG 
CAGTCGGAGC TGCACATTGA GCAGATGGTA GATTTTGTGC TGCTTTTAAT GCTGCCCGGT 
TCGGGCGATG AGCTGCAAGG CATTAAGCGA GGAATTATGG AAATTGCCGA TATGATTGCC 
ATCACCAAAT GCGATGGTTT GCAAGCCACC AGCGCGGCTA TTTCTCATGC AGAATTTGAA 
GCGGCGCTGC GCATGGTGCC AAAGCGCCAC CCCTTTTGGC AGCCAAGCGT GCAACTTACC 
TCGGCGGTTA CGGGTGTGGG CATTGCTGAG GTGTGGCAGC AAATTGAACG TTTTTTTGCT 
ATCATGCAGC AAGAGAATAG TTTAGAGACT CAGCGGCGTG AGCAACGGCG CCATTTGTTG 
GCAAATGTGC TGGAAGAGCA ACTCCGCCGC CTCTTTTTTA ACCACCCCAC AATTCGTCAG 
CAGCAACCCC ATCTTGTGCA GCAAGTGCTT GATGGCACGC TTAGCCCATT TACCGCCGCC 
ACACGCCTTA TTGAGCTGTT TCGCCACAAT CCAATAGGAG AGAAACAGTA G

Protein sequence

MPHHHTFDVE AIANAIMQGN RHQLSRAITL VESQRIEHHH VAEAILERCM ASNRHALRIG 
ITGSPGAGKS TFIEAFGEHI LSQGLRLAVL AIDPSSHHSK GSILGDKARM EKLSGRKEAF 
IRPTPSSGHL GGTSPRTHEA LLLCEAAGYD VIIVETVGVG QSELHIEQMV DFVLLLMLPG 
SGDELQGIKR GIMEIADMIA ITKCDGLQAT SAAISHAEFE AALRMVPKRH PFWQPSVQLT 
SAVTGVGIAE VWQQIERFFA IMQQENSLET QRREQRRHLL ANVLEEQLRR LFFNHPTIRQ 
QQPHLVQQVL DGTLSPFTAA TRLIELFRHN PIGEKQ