Gene Cagg_0894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0894
Symbol
ID	7267966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1122374
End bp	1124296
Gene Length	1923 bp
Protein Length	640 aa
Translation table	11
GC content	60%
IMG OID	643565742
Product	heavy metal translocating P-type ATPase
Protein accession	YP_002462249
Protein GI	219847816
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2217] Cation transport ATPase
TIGRFAM ID	[TIGR01494] ATPase, P-type (transporting), HAD superfamily, subfamily IC [TIGR01512] heavy metal-(Cd/Co/Hg/Pb/Zn)-translocating P-type ATPase [TIGR01525] heavy metal translocating P-type ATPase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000637035
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCACCA TTTCTAATAC TGCACCCCGG CAGCGCCTGA CGCTGCTGCT CAACGACGAA 
ATCCTCGAGC CGGCCTTTGT CGCTTTGACC CTGATCGGTA TCGTCACCGG TCTGATACTG 
GAAGGATCGG GTGCGCCGGA GTCGATCATC TTGGTCGTCC ATCTGGCTAC CTACTTTTTT 
GGCGGTTTTT ATGCAGTGCG GGCCATCATC GAGGCCTTAC GCCATTGGTC GATTGAAGTT 
GACCTGTTGA TGGTATTGGC AGCGCTCGGT GCGGGCTATT TAGGCGATTT TACCGAAGGT 
GCGATTCTGC TCTTTCTCTT TTCGTTGAGC AATGTGTTGC AAGCCTATGC AATGCGGCGT 
ACCGAACAGG CGATTACCGC GCTGATGCAG TTGCGCCCGG ATACGGTGAC GGTTCATCGC 
GATGGGCGTG AACTCGATCT GCCGATTGAG GCGGTGCAAG TGGGCGATGT GATAGTGCTT 
CGCCCCGGTG ACCGGGTGCC GCTCGACGGT GTGATCGAAC GGGGGAGCGG TTCGTTTGAC 
GAATCGGCGT TGACCGGCGA GTCGATGCCG GTGCAGAAGG GGCCGGGGAT GGCGGTGTTG 
GCCGGTACGC TTAACCAGAC TGGCGCGCTG GAAGTGCGGG TAACCAAGCC GGCCAGTGAG 
AGTACGTTGG CCCGGATTAT TACGATGGTG AGCGAAGCGC AGGCGCGTAA GGCGCGGTCG 
CAGAGCTTTC TTGAATATTT TGAGCAGCGG TATGCAATTG GCGTAATCGT TGCGGTGATT 
TTGTTCATCC TTGCCGTACC GGCGCTAACC GGAGCCGACT TTGCCGATAC CTTCTACCGC 
GGAATGGTGC TGCTCACAGT CGCTTCGCCG TGCGCGCTCG TGATCAGTGT ACCGGCTTCG 
TTACTAAGCG CGATTGCAGC CGGGGCGCGG CGTGGGGTGC TGTTCAAGGG TGGCGTGCAT 
CTTGAGGAAT TGAGCAAGGT ACGGGTGATC GCTTTCGACA AAACCGGCAC GTTGACCTTT 
GGTAAGCCGA CAATGACCGA TCTCGTGCCG ATGAATGGGG TGGACGAAGC CGATCTATTG 
GCGATTGTGG CCCGCGCCGA GCAACCTTCA GAGCACCCGA TTGCGCGTGC CATTTTGCAA 
GCCGCCGAAG AACGTGGGAT CACGGTTGCG CCACCCGAGC AGTTTACGGC TGTGACCGGG 
ATGGGTGTGC GTGCGATGTG GGAAGGGGTT GAGACACTGG TCGGTTCGCC GCGCTTGTTT 
GCCGAGGCCG GGGTGGTTAT GCCGTCGGAG TTGTCGGCGC GGGCCGATGA GCTAATGGCG 
CAAGGGCGCG GGAGTGTGTT GTTCGTTCGG CGTGGCGAGC AGTGGTTGGG ATTGGTAGCG 
GTGATGGATC GTGAACGGCC CGATGCAGCC CAGCGCATTG CCGAGTTGCG CGCTGCCGGT 
ATCGAGCGGA TCGTGATGCT GACCGGCGAT AATCCGCAGG TGGCGGAAGC GATGGCGCGC 
CGGCTGGGTG TGGATGAGGT GCATGCCGGC CTGTTGCCCG CCGATAAGCT GCGTATCGTC 
GAGCAGTTAC GCCAGCGTTA CGGTGGTGTG GCGATGGTCG GCGACGGTGT GAATGACGCA 
CCGGCGTTGG CGGCGGCGAC GGTGGGAATT GCGATGGGGG CTGCCGGTAC CGATGCGGCA 
CTCGAGACGG CCGATCTGGT GTTGATGCGC GATGATTTGA GTGCGATTAC TTACGCACTG 
CGGCTCAGCC GCCGCACCCA GCGCGTGGTC TGGCAAAATA TTATCTTTGC GCTGGCGGTT 
GTGGTAGTGT TGGTGACAAC AACATTGACG GTGGGTGTAC CGTTGCCACT CGGTGTGGTC 
GGGCACGAAG GCAGCACGAT TATTGTGGTG CTCAACGGGT TACGGCTATT GATGTTCCGC 
TGA

Protein sequence

MTTISNTAPR QRLTLLLNDE ILEPAFVALT LIGIVTGLIL EGSGAPESII LVVHLATYFF 
GGFYAVRAII EALRHWSIEV DLLMVLAALG AGYLGDFTEG AILLFLFSLS NVLQAYAMRR 
TEQAITALMQ LRPDTVTVHR DGRELDLPIE AVQVGDVIVL RPGDRVPLDG VIERGSGSFD 
ESALTGESMP VQKGPGMAVL AGTLNQTGAL EVRVTKPASE STLARIITMV SEAQARKARS 
QSFLEYFEQR YAIGVIVAVI LFILAVPALT GADFADTFYR GMVLLTVASP CALVISVPAS 
LLSAIAAGAR RGVLFKGGVH LEELSKVRVI AFDKTGTLTF GKPTMTDLVP MNGVDEADLL 
AIVARAEQPS EHPIARAILQ AAEERGITVA PPEQFTAVTG MGVRAMWEGV ETLVGSPRLF 
AEAGVVMPSE LSARADELMA QGRGSVLFVR RGEQWLGLVA VMDRERPDAA QRIAELRAAG 
IERIVMLTGD NPQVAEAMAR RLGVDEVHAG LLPADKLRIV EQLRQRYGGV AMVGDGVNDA 
PALAAATVGI AMGAAGTDAA LETADLVLMR DDLSAITYAL RLSRRTQRVV WQNIIFALAV 
VVVLVTTTLT VGVPLPLGVV GHEGSTIIVV LNGLRLLMFR