Gene Clim_2081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2081
Symbol
ID	6355059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2295929
End bp	2297074
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	51%
IMG OID	642669677
Product	glycosyl transferase group 1
Protein accession	YP_001944089
Protein GI	189347560
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.212135
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTG CCTTATATGC AGGGACGTAT GTCAAAGACA AGGATGGGGC TGTACGGTCG 
ATCTATCAGC TTGTCGCCTC GTTCAGGAAA CATGGTCACG AGGTTATCGT CTGGTCTTCA 
GACGTATCCG AGCAGGACAA TCATGGATCT CTGAAAGTAC TCCGTCTCCC TTCGGTACCG 
ATTCCGCTTT ATCCCGACTA TAAGCTCGGA TTTTTCAGTG CCGTTACAAA GCGGCAGCTC 
GATGCGTTCG CTCCGGATAT CGTTCATATA TCCACTCCGG ATATTGTGGG GCGCAGGTTT 
CTTCTCTACG CAAAAAACAA GAAGCTTCCG GCGACATCGG TCTATCATAC CGATTTCCCT 
TCGTACCTCA GTTATTACCG TCTGGGATTT GCTTTGGGAC CGGTCTGGAA GTACCTGAAA 
TGGTTCTACA ATACCTGTGA CCTTGTGCTT GCACCCAATG AGATCGTTCA ACGCAAACTG 
ACAGACAAGA GTATCAGAAA CGTTGAAATC TGGTCGAGGG GGATCGACAG GGAGTTATTT 
GATCCATCCC GGCGTTCGGA GCTGCTTCGA CAGGAGTGGC ATGCCGTTGA GCGAACGGTG 
TTTGTCTATG CCGGCCGTTT TGTGCTCTAC AAGGATATCG AAGTGGTCAT GAGCGTTTAT 
GAACGCTTTA TGAGAGAGGG CTTTATCGAT AAGGTTCGTT TCGTCATGAT CGGTTCAGGT 
CCAGAAGAAG AACAGATGCG AAGGCGCATG CCGCAAGCGG TTTTTACCGG TTATCTTATC 
GGTACGGCGC TGCCGGAGGC GTATGCAAGC GGGGATGTTT TTCTTTTTCC CTCTACTACC 
GAGGCGTTCG GAAATGTTGT GCTGGAAGCT TTCGCAACCG GATTGCCTGC TGTCGTCTCC 
GACGTTGGCG GTTGCATGGA GCTGGTTAAC GCATCGGAAG CCGGCCTGGT GGCAAAAGCG 
GGTGATATCG ATCAGTTTTA TGCCCATTGC CTTAAATTGC TCGATGATGC TCATACCCGC 
TCCTCGATGC GCAGGAAGGG GGTCCTTTTT GCCGAAAAAA AGTCTTGGGC TTCGGTAAAC 
GGAGCCCTGA TAGCCAGATA CCTTGAACTG ATTGCTGCAG GCCGTTCTGA AGCGGCGACA 
GGCTGA

Protein sequence

MKIALYAGTY VKDKDGAVRS IYQLVASFRK HGHEVIVWSS DVSEQDNHGS LKVLRLPSVP 
IPLYPDYKLG FFSAVTKRQL DAFAPDIVHI STPDIVGRRF LLYAKNKKLP ATSVYHTDFP 
SYLSYYRLGF ALGPVWKYLK WFYNTCDLVL APNEIVQRKL TDKSIRNVEI WSRGIDRELF 
DPSRRSELLR QEWHAVERTV FVYAGRFVLY KDIEVVMSVY ERFMREGFID KVRFVMIGSG 
PEEEQMRRRM PQAVFTGYLI GTALPEAYAS GDVFLFPSTT EAFGNVVLEA FATGLPAVVS 
DVGGCMELVN ASEAGLVAKA GDIDQFYAHC LKLLDDAHTR SSMRRKGVLF AEKKSWASVN 
GALIARYLEL IAAGRSEAAT G