Gene Clim_0914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0914
Symbol
ID	6354151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	996661
End bp	997968
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	58%
IMG OID	642668541
Product	glycosyl transferase family 2
Protein accession	YP_001942972
Protein GI	189346443
COG category	[M] Cell wall/membrane/envelope biogenesis [S] Function unknown
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis [COG3222] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.262835
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAGG AATCATCTTC CGGGCGCATG CTCATCGTCT TTACCCGCAA CCCGGTGCTT 
GGCAGGGTAA AGACGCGGCT CGGCGCTGAA ACAGGCCCGG AAACCGCGCT CAGGGTCTAC 
CGCATGCTCA GGGAGCTGAC CGCCTCGGTT ACGGAGGCGT GCAGCGCCGA GCGCGCGGCG 
TTCTACTCGG ATGAGATTCC GGATGCAGAC TGCTTTCTGA GAGGCGGAAC GCTCGCCTTT 
CTTCAGGAAG GCAGCGATCT CGGCGAACGG ATGCTTCATG CCTTTGAAAC CGGCTTTGCC 
GGGGGCTTCG GGCACATCGC GCTCATCGGC ACGGACTGTC CGGATCTGCA GACCAGCATA 
CTCGAACAAG CCTTTACCGA GCTCGAAAAC CATGATGCCG TGCTCGGGCC GGCAAAGGAT 
GGCGGGTTCT ACCTTATCGG ACTGAACAAA AGCCATCCCG AGCTCTTTCT CGACCGATCC 
TGGAGCCACA GCCGCGTCCT GCAGGAGACC ATCGACAGGC TGAACGAATA CGAAACAACG 
TTCGGCCTGC TCCCGGAGCT GCAGGACATC GACACCCTGG AGGATCTCAG GCAAAGCCGA 
CTCCGGAGTG CTGAAATGAT GGGTTCATTG AGCATTATAA TCCCGACCTT TAACGAGGAA 
ACCGGCATCG CCCGGACGCT GGATACCCTG CTCGCCCTTA CCGGAAGATA TGACGACGTA 
GAGATCATTG TCAGCGACTC GGGCACCGAC CGTACAGCCG AAATCGTCTC GGCCTTCCCC 
GTCACGCTCT GCCGGTCGGA AAAAGGACGC GCCCGACAGA TGAACGCGGG AGCCAAGCTC 
GCCAGACACC ATACGCTCTA CTTTCTGCAC GCGGACACCC TGCCGCCCGA ACGATTTGTC 
GATGACATTG TCGATGCGGT CGGAAGCGGA AAAGAGGCGG GATGCTTTCG GATGCAGTTC 
GACGACCCGC ACCCCATCAT GACCCTCTTC GGCTGGTTCA CCAGAGTTCC CCTTTCGATC 
TGCCGGGGCG GCGACCAGTC GCTCTTCATA ACAAAAGAGC TGTTCGACGC TCTCGGCGGG 
TTCGACGAAA GGATGCAGGT GATGGAGGAT ATCGACATCA TCGAGCGCAT CGAGCGCCGG 
GGAACCTTTC ACATCCTCGA CAACCACGTC GTGACTTCGG CAAGGAAATA CCATAAAAAT 
GGCATCCTGC GTCTGCAGGC GATCTTCGGC ACCATCCATC TGATGTATGC GCTGGGGTAT 
GATCAGGAGA GCATTATCCG TTACTACCAG GAAAATATCG AATCGTAA

Protein sequence

MKQESSSGRM LIVFTRNPVL GRVKTRLGAE TGPETALRVY RMLRELTASV TEACSAERAA 
FYSDEIPDAD CFLRGGTLAF LQEGSDLGER MLHAFETGFA GGFGHIALIG TDCPDLQTSI 
LEQAFTELEN HDAVLGPAKD GGFYLIGLNK SHPELFLDRS WSHSRVLQET IDRLNEYETT 
FGLLPELQDI DTLEDLRQSR LRSAEMMGSL SIIIPTFNEE TGIARTLDTL LALTGRYDDV 
EIIVSDSGTD RTAEIVSAFP VTLCRSEKGR ARQMNAGAKL ARHHTLYFLH ADTLPPERFV 
DDIVDAVGSG KEAGCFRMQF DDPHPIMTLF GWFTRVPLSI CRGGDQSLFI TKELFDALGG 
FDERMQVMED IDIIERIERR GTFHILDNHV VTSARKYHKN GILRLQAIFG TIHLMYALGY 
DQESIIRYYQ ENIES