Gene Clim_1851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1851
Symbol
ID	6355192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2031024
End bp	2032244
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	60%
IMG OID	642669455
Product	glycosyl transferase group 1
Protein accession	YP_001943869
Protein GI	189347340
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC AACCCATAGC TTACCTCTGC AGCGAGTACC CGGCCATCTC CCACACCTTC 
ATCTACCGGG AAATCCAGTC GCTCCGCAAA GAAGGGTTCA CCGTGCACAC CGCATCCATC 
CACAAACCCG GCGGTCTCGA CATCATGACC CCCGACGAAC AGGAAGAGGC CCGAAACACC 
CTCATGGTGC TCGACCATTC GATACCGGCA ATCGCCGGAG CACACATCCG CTGCCTCGCC 
GGCAACCCCA AAGGCTACCT CCGCATGGCC ACAGCAGCGC TCGGGCTACT CGTCTCGGGT 
CCAAAAAGTC CGCTGAAAGC CATAGCCTAC TTCGCCGAAG CTGGCATCCT GCTCCAGTGG 
ACGCGCCTGA ACGGCATCGC CCACATCCAC GAACACTTCG CCAACCCCAC AGCCATAGTC 
ACCATGCTCA TGAAACAATA CGGCGGCATC ACCTACAGTA TCTCCGTGCA CGGCCCTGAC 
ATATTCTACA CCGTCGACAC AGCCATGCTC CAGGAAAAAA TCAGGCAAGC CTCCTTCGTG 
CGATGCATCA GCCACTATTG CCGCAGCCAG GTCATGCGCC TCAGCGACCC AGTCATCTGG 
AACCGCTTCC ACATCGTACG CTGCGGCATT GACCCCGATC TCTACGCTCC GCGCCCCGAC 
CCCGGCAACG CCGTTCCCCG GCTCCTCTGC GTCGGAAGGC TTGTACCTGC CAAAGGCCAG 
CACATTCTGC TCGAAGCCTG CGCCATCCTT AAACGTCAAG GCACCCCCTT CCATCTCACG 
TTGACCGGCG ACGGGCCTGA TCGCGCTTCG CTCGAACAGC ATTCCCGCAC ATGGGGTATT 
CAGGAACTCG TCACCTTCAC TGGCGCGCTC GGACAGGACA ACGTCCGCCT GCTTTACGAC 
CAGGCCGACA TCTTCGTGCT TGCAAGCTTC GCCGAAGGCG TTCCGGTAGT GCTCATGGAA 
GCCATGGCCA AGGAAATACC CGTCATCTCC ACACGAATCA CCGGCATCCC CGAGCTCATC 
GACCATCAGC ACGACGGCCT GCTTGCCATA CCCGGCGACC CCGTAGACCT CGCACTGCAG 
CTCACCATGC TGCTTGCCGA CCCGACACTG CGCCGACAAT ACGGTAGGGT CGGCCGTCAG 
AAAGTGATCG AACGATACAA TCAGCACCGA AACAACGCTC GACTCGGCGA ACACTTCAGG 
AACCAGTACA GCAACCCATG A

Protein sequence

MKKQPIAYLC SEYPAISHTF IYREIQSLRK EGFTVHTASI HKPGGLDIMT PDEQEEARNT 
LMVLDHSIPA IAGAHIRCLA GNPKGYLRMA TAALGLLVSG PKSPLKAIAY FAEAGILLQW 
TRLNGIAHIH EHFANPTAIV TMLMKQYGGI TYSISVHGPD IFYTVDTAML QEKIRQASFV 
RCISHYCRSQ VMRLSDPVIW NRFHIVRCGI DPDLYAPRPD PGNAVPRLLC VGRLVPAKGQ 
HILLEACAIL KRQGTPFHLT LTGDGPDRAS LEQHSRTWGI QELVTFTGAL GQDNVRLLYD 
QADIFVLASF AEGVPVVLME AMAKEIPVIS TRITGIPELI DHQHDGLLAI PGDPVDLALQ 
LTMLLADPTL RRQYGRVGRQ KVIERYNQHR NNARLGEHFR NQYSNP