Gene Clim_1977 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1977
Symbol
ID	6355481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2194516
End bp	2195574
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	57%
IMG OID	642669575
Product	protein of unknown function DUF900 hydrolase family protein
Protein accession	YP_001943988
Protein GI	189347459
COG category	[S] Function unknown
COG ID	[COG4782] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.574903
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATACATA CGTTCAGAAC CGTTTTTGCC GTGCTGCTGC TGGCGCTGGA ACTTGCCGGG 
TGCACCGCCT CCTTTCAGGC AGTGCAGCAG CGCCCGGTTC TTTCGCTGTT TTACGCGACC 
GACCGGGCCA TGTCCGGAAG CAGCGAACCG GGGGAGTTCT ACAATTCGGA TCACGCTCCG 
CTGCAGTATG GAACCTGCAC AGTCTCGGTG CCGCAAAAGC ACCGCATAGC CGAGCTTGAA 
AGGCCGGTGC TGAGCATGCA TCCGGAACGT CATTTTGAAC TTCTTTCGAT CGATACCCTC 
GACAAGCAGG TTTTTTTCGA TAAAGTGGGG CTCTTCATGC AGCGCGCCGG CAGCCGGAAA 
ACTGCTCTGG TATTTGTTCA CGGTTTCAAC ATAAGTTTCG AGGCCGCCAC ACTGCGCATG 
GCCCAGATGA CCTCCGATCT CGATTTCAGA GGCACACCGC TGGTCTACAG CTGGCCGTCG 
GACGCTTCGC TCGGTTCATA TCGCGAGGAC GAACGGAGCG TTGTCGAAAC CGAAGGCAAT 
CTTTACCGTT TTCTTTGCGG TATAGCCGAG CGTTCCGGAA AGGCAGGCAT CTATCTGCTT 
GCCCACAGCA TGGGAACCCG TGCCCTGACC TCGGCTTTCA TCATGCTTGC AAAAGAGCGC 
CCCGAACTGC TTTCCCGTTT CGGTGCCATC GTGCTTGCCG CGCCGGATAT CAATGCGGAA 
CGCTTCAGAC GTGAACTTGC GCCATCCCTC GCAGGCAACG GGGTGCCGGT AACGGTTTAC 
GCTTCGCGTT CGGACAATGC GCTCAGGGTC TCCGAAAATG TCAACGGCAA CCCGAGGGCC 
GGTGAAGTCG CAGATATACC GCTTATCGTG CCCGGCATTG AAACCATCGA TGCCACCGAT 
GTCGACAGCG ATCTTCTTGG CCATTCCTAT TACAACCGCT CCAGAACGGT GCTTTCGGAC 
ATGTTTTATA TCATCAGCAG AGGACTTCCC GCCTCGGAGC GTTTTTCTCT CCAGCCGGTC 
GATACCGCGG CGGGGAGGTA CTGGAGGTTC CGTAAATAG

Protein sequence

MIHTFRTVFA VLLLALELAG CTASFQAVQQ RPVLSLFYAT DRAMSGSSEP GEFYNSDHAP 
LQYGTCTVSV PQKHRIAELE RPVLSMHPER HFELLSIDTL DKQVFFDKVG LFMQRAGSRK 
TALVFVHGFN ISFEAATLRM AQMTSDLDFR GTPLVYSWPS DASLGSYRED ERSVVETEGN 
LYRFLCGIAE RSGKAGIYLL AHSMGTRALT SAFIMLAKER PELLSRFGAI VLAAPDINAE 
RFRRELAPSL AGNGVPVTVY ASRSDNALRV SENVNGNPRA GEVADIPLIV PGIETIDATD 
VDSDLLGHSY YNRSRTVLSD MFYIISRGLP ASERFSLQPV DTAAGRYWRF RK