Gene CHU_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CHU_2023
Symbol
ID	4184548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cytophaga hutchinsonii ATCC 33406
Kingdom	Bacteria
Replicon accession	NC_008255
Strand	+
Start bp	2356175
End bp	2357326
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	36%
IMG OID	638072026
Product	glycosyltransferase
Protein accession	YP_678631
Protein GI	110638422
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATAATT TTTTAGTTAT TTTTAAGAAT ATGATGAAAC ACAGAATTTT ACTGGGTTCG 
GTCTTAAAGC CAACAAATGA TTCCCGAATG TACGAAAAAA TCGGGGAAAG TCTGAGCGTT 
TTACCAAATT CAGAAATTCA TGTTGCCGGA TATAAAAGTG AACAGAACGA CCTGAAAAAT 
ATCCGGTTTT ATCCAATTTT TTCCTCCGCG CGCCTATCCG TTTTACGGTT TATTGCACCT 
TGGAAATTTC TCTTTTTAGC AGTTAAAGTA AAACCTCATA CCATCATATG TTCAACACAT 
GAATTACTGC TAGTTACCTG TTTATACAAA ATATTATTTG GTTGTAAATT TATTTACGAT 
GTACAAGAAA ATTACTTTTA TAATATCCTC TATACCGACA CATTCCCGTC TTTTTTAAAG 
CCTGTTCTTG CTCATTGGGT GAAGCTAAAA GAAACCGTGT GTAAAAAGCA ATTAGACGGC 
TATTTATTAG CAGAAAAAAC ATATCAACAG GAACTCAACG GACGTATTCA TGAACCTGCT 
CTTGTACTTG AAAACAAGTA TCAGGGTGCT TGTCCGAACA AATTGGAAAT AGTAAAAATC 
ACAGAAGGAA ATAAAATCCG GCTGTTGTAT TCCGGAACAA TTGACACTTC TTACGGAGTT 
TTTGAAGCAA TTGATTTAAT TATACGGCTT TACTTACTTG ACTTCCGGTT TGAATTAACC 
ATCATTGGTT TTGCCCCCAA TAACCGTGAA CTTACTAAAG TCAAAAACCG CATCGCTCCC 
TACCCGTTCA TCAAGCTTAT CGGGGGCGAT AAACCTGTAC CACACCCTGA CATTTTATCA 
GCTATCAAGA CCCACGACTT CGGATTACTC CCGTACCGTT TTAATGAAAG TACAACCCTT 
CGGGTACCTA CCAAACTGTT TGAGTATTTA CTGAATCATC TTCCGGTTAT CAGTTCACAC 
AATAAAACAT GGGAGGAATA CATCAAAAAA TTCAATGCCG GTATCATTAT TCCTTTTTCA 
GATCTTCCTA AAGCAACGAT CATAAAAGAA CAGATTTTAA ATACAGAGTT TTATACCCAG 
GGCAACCCGG CCGAATTGAT CTGGGAAGAA TCAAAATTAT TGAACTGGTA CAGCGAACAC 
TTTTTAAACT AA

Protein sequence

MYNFLVIFKN MMKHRILLGS VLKPTNDSRM YEKIGESLSV LPNSEIHVAG YKSEQNDLKN 
IRFYPIFSSA RLSVLRFIAP WKFLFLAVKV KPHTIICSTH ELLLVTCLYK ILFGCKFIYD 
VQENYFYNIL YTDTFPSFLK PVLAHWVKLK ETVCKKQLDG YLLAEKTYQQ ELNGRIHEPA 
LVLENKYQGA CPNKLEIVKI TEGNKIRLLY SGTIDTSYGV FEAIDLIIRL YLLDFRFELT 
IIGFAPNNRE LTKVKNRIAP YPFIKLIGGD KPVPHPDILS AIKTHDFGLL PYRFNESTTL 
RVPTKLFEYL LNHLPVISSH NKTWEEYIKK FNAGIIIPFS DLPKATIIKE QILNTEFYTQ 
GNPAELIWEE SKLLNWYSEH FLN