Gene CHU_3353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CHU_3353
Symbol
ID	4185048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cytophaga hutchinsonii ATCC 33406
Kingdom	Bacteria
Replicon accession	NC_008255
Strand	-
Start bp	3832413
End bp	3833423
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	37%
IMG OID	638073342
Product	virulence protein
Protein accession	YP_679932
Protein GI	110639722
COG category	[R] General function prediction only
COG ID	[COG3943] Virulence protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0319779
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0105196
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGAAA AGCAAAACAT CATTATTTAT AACACCCAAG ATGGGAAAGC TGCTGTTTCC 
TTATATGCAA AAGATGGCTC TGTATGGATG AATCAGCAGC AACTGGCAGA GCTTTTTGAC 
ACAACCAAGC AAAATATAAG TCTGCACATT CTTAATATAC TTGAAGAGAA CGAGTTAAAT 
GAAGCGGCAG TTGTCAAGGA TTACTTGACA ACTGCCGCGG ATGGAAAAAA CTATAATGTA 
ACTTTTTACA GCCTGGATAT GATCCTTGCA ATCGGGTTCA GGGTTAGAAG TAAAAGAGGG 
ACACAATTCA GGCAGTGGGC AAATCGTAAC TTAAAAGAGT ACATGGTAAA AGGATTTATC 
ATGGACGATG AGCGATTGAA AAATCCGGAT GGCAGACCTG ATTATTTTGA TGAATTGCTG 
GCTCGTATCA GAGATATACG TGCTTCTGAG AAAAGATTCT ATCAAAAAGT ACGTGACCTG 
TTTGCGCTTA GTAATGATTA CGATAGCACC GACAAAACCA CACAATTGTT TTTTGCCGAA 
ACACAAAATA AGCTGTTGTT TGCAATTACA GGAAAAACAG CAGCGGAAAT AATTGTAAGC 
AGAGCTAAAG CCGATGAACC CAATATGGCT TTGACCAGTT GGGAAGGAAG TATTGTACGA 
AAGCAAGACA CCTTTATTGC TAAAAACTAT TTAACAGATG ATGAAGTTGA TAGTCTTAAT 
CGTTTTGTAG TTGTGTTTCT GGAAACCGCT GAATTGAGAG CGAAAAACAG ACAGGATATC 
ACAATGAATT TTTGGAGGGA AAACGTTGAT AAAATTATAG CGCTTAACGA TAAACCTATA 
CTGAAAGGTA AGGGAAGTAT TAGCCATACA CAGATGGAAA AAATGATAGA GCACGTATAT 
AAAACATTTG ATGCGAAACG AAAACTTGAA GATGCTCTGA ATGCGGATGC GGAAGATCTG 
AAAGAGATAA AATCATTAGA AGATAAAATT AAGAACAGAA AAAATAAATA G

Protein sequence

MQEKQNIIIY NTQDGKAAVS LYAKDGSVWM NQQQLAELFD TTKQNISLHI LNILEENELN 
EAAVVKDYLT TAADGKNYNV TFYSLDMILA IGFRVRSKRG TQFRQWANRN LKEYMVKGFI 
MDDERLKNPD GRPDYFDELL ARIRDIRASE KRFYQKVRDL FALSNDYDST DKTTQLFFAE 
TQNKLLFAIT GKTAAEIIVS RAKADEPNMA LTSWEGSIVR KQDTFIAKNY LTDDEVDSLN 
RFVVVFLETA ELRAKNRQDI TMNFWRENVD KIIALNDKPI LKGKGSISHT QMEKMIEHVY 
KTFDAKRKLE DALNADAEDL KEIKSLEDKI KNRKNK