Gene Clim_1884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1884
Symbol
ID	6355225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2089142
End bp	2090425
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	45%
IMG OID	642669484
Product	hypothetical protein
Protein accession	YP_001943898
Protein GI	189347369
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5434] Endopolygalacturonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGCG GTTTACGCTC CATATTTCTC ATACTGTGGT GTGGTCTGCT GCCCGCTAAG 
AACGGTAGTG CATATGCTGC ATTCAATACG TTCAGCCGAG TCAGCGACCT GAATTCACTT 
CGTCAACTGA GTGAGCAGAT GGTATTTGTG CTGGGATACA GTGAACCCGG AGACGGTGGT 
GGTGGATGGT TTCGCTGGGA ACCAAATATA ATGGAGGAGC CCGACGGGAG TATGCGGATT 
CGCCCGCATT CATTCAAACA AGGATGCTTT GCACGGGTAA CTGATGGTGC CGGATTGAAT 
GTCAAATGGT TCGGTGCTAA AGGTGACGGT AAACACAACG ATACGGAGGC CATTCAATCC 
GCAATTGAAT GGGCCTCCGC TCGACAATCT TTTTTTCAGC AGTCAATTGC AGTCCGTGAC 
CTGGTGCTGA TACCATCCGG TCAGTTCCTG GTAGACAGCC TAGAACTAAA AAGCGGGGTG 
ATCCTGCAGG GTGCAGGCCA GTTTTCCTCC GTGATCCTTC ATACGGGAAA CTCAAGCCGT 
TGCATCTACA ATGAAAAAGG CCATCACAAC CGCTGGGTTG GAATCCGGGA GCTCACCGTG 
ATCGGTTCCG ACAATAAGGG TACCTATACA GAAGGTATTC ATCTGTTTGA GGCCAATTAC 
AGCAGCTATA TTAACCGGAT TACTATTCGG GGCTTCACCC AAAATATTGT TCTGGAAGAT 
TGCTGGACTT TCCAGCTTAC CCGTTCACAT CTGTTCAAAG CCCATCGCAA TAATCTAACC 
ATCCTTAATG GTACAGCAAT GGAGATTTCT GGGAACCGGA TTGACGGTGC CGGAAAATCG 
AATATTCAGA TAAGCCGAAG TAAAAGATAC AGGAACACTG GAATCCTGAT CAGAAACAAT 
GCCATTCAGC AAGCTCAGGA ATACGGATTG TATTGCAGGG ACACCAACTC ATTATTGCTA 
GAAGGAAACT TCTTCGAAGC TAATAACCGA AATGGAGGCT TCGCCTTTGT TTATATTGAA 
GGGCCTCAAA CAAGCAAGCA TTGCCTTATA CATTCTACAT CGAATTACTT TTCAGGAGCA 
AATAAATCAG CGCCAAATTC CGTCGGGATA TTTCTGAAAG GCAATGTGAA AAGCTTTTCA 
TCGAATCAGG ATTACTTCTC CGGTAGTATG GGATACGGAA TATATTCAGT TGACCTGCAA 
TCCAAAGAAT TTGTGATTTC AGGCACTACA TTTCATTCTA AATCCGACTT AAAATTACCT 
TCAGATATTA AAATTATTAA TTAA

Protein sequence

MKSGLRSIFL ILWCGLLPAK NGSAYAAFNT FSRVSDLNSL RQLSEQMVFV LGYSEPGDGG 
GGWFRWEPNI MEEPDGSMRI RPHSFKQGCF ARVTDGAGLN VKWFGAKGDG KHNDTEAIQS 
AIEWASARQS FFQQSIAVRD LVLIPSGQFL VDSLELKSGV ILQGAGQFSS VILHTGNSSR 
CIYNEKGHHN RWVGIRELTV IGSDNKGTYT EGIHLFEANY SSYINRITIR GFTQNIVLED 
CWTFQLTRSH LFKAHRNNLT ILNGTAMEIS GNRIDGAGKS NIQISRSKRY RNTGILIRNN 
AIQQAQEYGL YCRDTNSLLL EGNFFEANNR NGGFAFVYIE GPQTSKHCLI HSTSNYFSGA 
NKSAPNSVGI FLKGNVKSFS SNQDYFSGSM GYGIYSVDLQ SKEFVISGTT FHSKSDLKLP 
SDIKIIN