Gene Clim_0502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0502
Symbol
ID	6354849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	568652
End bp	569719
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	54%
IMG OID	642668135
Product	glycosyl transferase family 2
Protein accession	YP_001942574
Protein GI	189346045
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.925562
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGACG ATTTTCAGCT CCTTCCTCCG GTTGATATTA TCATTCCCCA TTACCGGGGT 
GAGGAGCATC TCGAACGCTG CCTTCGCTCT CTGGCAAATA CCCGTTACCC GTCGATGGGC 
ATAGTGGTCG TCGATAATGC AAGTCAAACT CCGGGACTGC AAGAGCTGAT CGAAAGGTTC 
GCCGGCGTCC GTCTGCTTGC ACTGCCGCAG AACAGAGGTT ATCCGGGTGG CTGCAACGCG 
GGTTTCAGCG CAACGAAAGC CGAATTTCTT GTGTTCATGA ACGACGATAC CCGACACGAT 
CCGAACTGGC TCGAACCGCT TGTTACGGCA GCACGTCGGG ATGGGTGCAT TGCTGCCCTG 
CAGCCGAAAA TTCTCTCTTT GCGGGAATTC GAACAAGGGA ATAACCGCTT CGACTATGCC 
GGGGCTGCGG GAGGGATGCT CGACAGGCTC GGCTATCCCT GGTGCTATGG CCGGACTTTT 
TCCGGAGTTG AAACGGATAA TGGCCGGTAC GACACCCCGC GGAATATTTT CTGGGCCTCG 
GGCGTAGCCA TGTTCGTCCG TCGGAGTGTG TTTGAAGAGC TTGGCGGGTT TGACGACTCT 
TTTTTCATGC ACATGGAAGA GATAGATCTT TCATGGCGTA TGCAGCTTTC CGGATACACG 
GTCCGGTCGG TACCTTCATC GGTGGTTTAT CATGAAGGCG CCTCTTCGCT TGCATACGGC 
TCCCCTGAAA AAACCTATTA CAATCACCGA AACAATCTTC GTATGATGCT CAGGAACATG 
AGTGTCGGGT CACTGATGGT GGCTTTTTCC GCCCGTTTGT TGCTCGAACC CGCAGCGGCC 
CTGTTTTATC TCACGAAGGG GCGCAGAGGG TATCGCAACG CTTTTGCCGT CCTGAAAGCG 
TTACGGGATT TTCTGATGGA GCTGCCTGAA ACGCTGAGAA CTCGAACGCG GGTGCAGGCT 
TTACGGAAAA GAACCGACAA AGCACTGTTC AAAGGGCTGC CGTTCAGTAT TTTTTACCCT 
TGGCGGAAAA GTTTTTTTAA TCACGCCGGT CAAGATGGCC TTTGCTGA

Protein sequence

MRDDFQLLPP VDIIIPHYRG EEHLERCLRS LANTRYPSMG IVVVDNASQT PGLQELIERF 
AGVRLLALPQ NRGYPGGCNA GFSATKAEFL VFMNDDTRHD PNWLEPLVTA ARRDGCIAAL 
QPKILSLREF EQGNNRFDYA GAAGGMLDRL GYPWCYGRTF SGVETDNGRY DTPRNIFWAS 
GVAMFVRRSV FEELGGFDDS FFMHMEEIDL SWRMQLSGYT VRSVPSSVVY HEGASSLAYG 
SPEKTYYNHR NNLRMMLRNM SVGSLMVAFS ARLLLEPAAA LFYLTKGRRG YRNAFAVLKA 
LRDFLMELPE TLRTRTRVQA LRKRTDKALF KGLPFSIFYP WRKSFFNHAG QDGLC