Gene Clim_2120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2120
Symbol
ID	6355098
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2340375
End bp	2341778
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	53%
IMG OID	642669711
Product	metal dependent phosphohydrolase
Protein accession	YP_001944123
Protein GI	189347594
COG category	[R] General function prediction only
COG ID	[COG1078] HD superfamily phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGCTG AACAATTCCT GTTCCAGGCC GAAGGCGGAT TCATCAGGCT GCCGGTATGG 
GGACATATCG CCCTGAGCAA CCCTCTGAAG CATATTCTTG CCCATCCTTC GTTTCTGCGC 
CTGAAAGGCA TACGGCAGTT ATCGTTCTCC CAGCAGGTAT ATCCGGGAGC TACGCACACC 
CGTTTTGAAC ATTCGATCGG CGTGTACCAT CTGATGAAAC TGATTCTGCA GCGTATGGTG 
AGCAACCCGC TTGCCGTCGG ACTGCAGAAT GGGAGGTTCC GGTTTGACGA CGGGAGCTGC 
CGTCTGCTTC TGGCTGCCAG CCTGCTGCAT GATATAGGCC ATTACCCGCA TGCCCATGTG 
ATCGAGGAAC AGATTCCTGC CGGCAGTTGC GGCCCGGTGT TCTCGCATCA CGAAGATCTT 
TGCGGAAGAT TTATCTTTCA GGAACAACCG GGATTTCCCC CGATTGCCGA AATCCTTCAC 
AATGAGTGGA AGGTTGATGC CAAAGAGGTG ATCGCGCTGA TCGAAGGCAC CTCGACAAGC 
GGTTTCGGCA AATTGATCAG CGGCACCCTC GACCCTGACA AGATGGATTA CCTGATGCGC 
GATGCGCACC ACTGCAACAT ACCCTACGGA AGCATCGACA TCGAACGGCT CATCGAGTCG 
TTTGTGCCGG ATCCCGAACG TGAGCGGTTT GCCATTACTG AAAAAGGAAT CGCGCCGCTT 
GAGAGCCTGC TGTTTGCCAA ATACATGATG ATGCGCAATG TGTACTGGCA TCATACCGGC 
AGGGCGCTCT CAGCCATGCT CAGACGGCTG CTGCAGGCAG TAATCGATGG AGAGCTGCTG 
AGCGGACAAC AGCTGGAATC GCTCTTTTAC GACAATGCCG ACGACCGGGT ACTCTTCGAA 
CTGAGAACGA TGCTGCCACA GAGGGTTTCG GGGGAAACCC TGCTGCTCGA CGATATTCTG 
CAGCGCAGGG TATATAAACG GGTAGTCACC ATTCAGCCAT ATACGAAAAA CGGAATGGAC 
GAACGCTGGT TCGCCTATGC CTCGGACAAT TCGTTCTGCC GGCAAAAAGA GCGGGAAATA 
TGCGGTTTTC TCTCCAAACG CCATAACATG AACCTCAGCG GTCTGGAGGT ATTGATCGAC 
CCTCCGTCAA AAAAGGACAT TTTCGATTAC AACGATCTCA GAGAGCTGCG GGTTTACCCT 
ACCCGATCGG AACACCTGCA CTATTCGCTG CAGCTCTCTT CGGAGTACTG CCGTTTCGAT 
GATTTCGACG AATCGGTCTT CCGTTCGGAT TTTATTCTAT CGTTCGAGCG TTACACTAAA 
AAATTCAGAC TGCTCTGCAG GGAAAATATT ATGGAAAAAG TATCCGAGTC GATGAACGGG 
GTAATGGAGA TTCTGCAGTC GTGA

Protein sequence

MIAEQFLFQA EGGFIRLPVW GHIALSNPLK HILAHPSFLR LKGIRQLSFS QQVYPGATHT 
RFEHSIGVYH LMKLILQRMV SNPLAVGLQN GRFRFDDGSC RLLLAASLLH DIGHYPHAHV 
IEEQIPAGSC GPVFSHHEDL CGRFIFQEQP GFPPIAEILH NEWKVDAKEV IALIEGTSTS 
GFGKLISGTL DPDKMDYLMR DAHHCNIPYG SIDIERLIES FVPDPERERF AITEKGIAPL 
ESLLFAKYMM MRNVYWHHTG RALSAMLRRL LQAVIDGELL SGQQLESLFY DNADDRVLFE 
LRTMLPQRVS GETLLLDDIL QRRVYKRVVT IQPYTKNGMD ERWFAYASDN SFCRQKEREI 
CGFLSKRHNM NLSGLEVLID PPSKKDIFDY NDLRELRVYP TRSEHLHYSL QLSSEYCRFD 
DFDESVFRSD FILSFERYTK KFRLLCRENI MEKVSESMNG VMEILQS