Gene Clim_1850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1850
Symbol
ID	6355191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2029939
End bp	2031027
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	57%
IMG OID	642669454
Product	glycosyl transferase family 2
Protein accession	YP_001943868
Protein GI	189347339
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACACA CCCATCAGAA CGACGGAAGC CAGGAATACC TGCCATCCAT CGACTGCGTA 
CTCATCGGAG TCAACTGCGC CAGCACCCTC AAACGATGCA TCGACTCCAT CCTGGCCTGC 
GACTATCCCA AAGAAAAGCT CCGCATCATC TATGTTGACG GAGGATCAAG CGATACGAGC 
AAAGCCATAG CGACGGCATA TCAAAACGTC ACGCTTATCG CGCTCGACCT CCTGCACCCG 
ACTCCAGGCC TGCAGCGCAA TGCTGGATGG AAAAACGGAA CGGCCCCCTT CGTGCAATTC 
CTCGACTCCG ATACCATCAT CGACCCCGCC TGGCTCCGTG CTGCGACAAC AGCCATACAA 
GACCCGGCAA TCGGAGCAAT CAACGGCTAT CGCCGCGAAC TGCACCCCGA ACGCACCATC 
TACAACTGGA TAGGCGACAT CGAATGGAAC GGCCCTCCAG GACAATCAGA CTGCTTCGGC 
GGCGACGTAC TCATCCGGCG CACTGCACTT GAAGAAAGCG GCGGATACGA CGAAACCCTT 
GTCGGAGGCG AAGACCCCGA ACTCAGCCGG AGAATTATCA GAAACGGATG GCAGATCAGG 
CGCCTCTACG CCCTCATGAC CAGCCACGAC CTTGCCATGA CCACAATCAG GCAATATCTC 
AAACGAGGCT TCCGATCCGG TTACGGCTTC GCTGCCGTTC GCCTGCGCGA AGCAAAAGCA 
GGCAGCAGCT TCTGGAAACC GGAAAACCGC AAAATCCTCA TCAAAGGCGG CGGATTCCTC 
ATCGGCGCAA CAGCGGCGCC CCTCATTGCG CTCACGCAGC ACAACGTCCG GGGAACAATC 
CTCTCGCTCG CGAGCCTGCT CGGCGGCACA GCCCTGCTCC TCAACCCCAG GATATTCAAA 
GTCGAAAAAT TCATGCGCGA CAACAAACTC CGCCGCGAAG AAGCAAAAAT CTACGCATGG 
CACTGCTCGC TCGTCGTGCT GCCACAGCTC CTCGGCATAA TCCGATTCCA TGCCGGCCGA 
CTCCTCGGAA AACCGCTCAC GAACAAACGA GCGGTACTCA AAACCGGACT CTCAACCACC 
CGGACATGA

Protein sequence

MKHTHQNDGS QEYLPSIDCV LIGVNCASTL KRCIDSILAC DYPKEKLRII YVDGGSSDTS 
KAIATAYQNV TLIALDLLHP TPGLQRNAGW KNGTAPFVQF LDSDTIIDPA WLRAATTAIQ 
DPAIGAINGY RRELHPERTI YNWIGDIEWN GPPGQSDCFG GDVLIRRTAL EESGGYDETL 
VGGEDPELSR RIIRNGWQIR RLYALMTSHD LAMTTIRQYL KRGFRSGYGF AAVRLREAKA 
GSSFWKPENR KILIKGGGFL IGATAAPLIA LTQHNVRGTI LSLASLLGGT ALLLNPRIFK 
VEKFMRDNKL RREEAKIYAW HCSLVVLPQL LGIIRFHAGR LLGKPLTNKR AVLKTGLSTT 
RT