Gene Veis_3456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_3456
Symbol
ID	4691530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	3829609
End bp	3830943
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	62%
IMG OID	639851213
Product	extracellular solute-binding protein
Protein accession	YP_998195
Protein GI	121610388
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.559777
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATGA CATCGCACCT GGCCGCCATT GGCCTGCTCG CCTGCGCTGC GGGCAGTGCG 
CTGGCCCAGG CCAGAACGGA GATCACGCTG GCGCGCTTTT TCGGCTCTTG CGAGGCCGAC 
TACGGCAAAT CGATCGACGT GAAAGCAGCG CGTGGCGAGT GCGGCATCAT CACGACGCTG 
GTCAACAAAT TCAATGCGAC CAACAAGGAC AACATCGTCG TCAAGCCGCA GATCGTGGAG 
TGGGGCCCGT ACTACGACCA ACTCACGGCG CGCATCGTGG CGCGCGATGT GCCGACCATC 
GCGGTCATGC ACGAATCATC GCTGGGCGAC TTCGTCCATC GCAAACTGAT CGAGCCGATG 
GACGACAGTT TCAAGTCGGT GGGCATCGAC ACGGCGCAGT TCAGCGATCA GGCCCGGGCC 
GGGACCAGTT TCTCCGGCAA AACCTACGCG CTGCCTTTCG ACACCCACGC CTGGCTCTGG 
CATTTCAACC TGAACCTCAT GAAGAAGGCG GGCCTGACCA AACCGGACGG CAGCCCCGTC 
ATTCCAGGCT CGCCGGAAGA ACTGTTCGCC CAGGCCAGGC AGTTCAAACA GGCCACGGGC 
AAGCCCTACT TCGCGTGGCA AACGGTCAAC TCGTCGGCGT CCTACATGCG CACGTTTCTC 
ACGCTGCTCT ATCAGCAGAA CGGCGCCAAG CTGTTTACGG ATGGCGCCAA GCCGCGCATC 
GACATGAAGT CGCCGCAGGC GACCAAGGCG CTGAAGCTGA TGAACCAGAT CTACAGCGAA 
GGTCTGGTCA TGACCGGCCT CGACTACGGC CCCTCCAACC AGGCCTTTGT CAATGGCGAG 
GTCGGCGTTG TCGTCGTGGG CACCTGGAAG ATCGACGACT TCGTGGCGCA AGCCGAGAAA 
GCCGACACCC CCTTGGCAAA AGGCTATGCG GTCTATCCCT TCCCGCAGTT GTTCGACCAG 
AAAGCGGTGT GCGCCGACGG CCACAGTTGG GTGATGCTCA AGGGCGGGGC CAAGGACGAG 
GCCAGCCGCA AGGCCGCGCT CGCCTTTCTG AAGTTCATCT GGGACAACGA CGTGGAATGG 
GCGCGCACCG GCCACCTGCC GATCAGCAAG CTGACACTGT CCAGCCCGGG GTTCAAAGCC 
TTGCCGATGC GCAGCAACAT CGCCGAGATA TCCGCCAGCG GCCGCGGCAT ACCGCTGTCC 
ATTCCGCGCC AGCGGGCGAT ACAAATCGCG GTAGACCAAG AGATAGGCAA CATGCTGACC 
AGCAAGAAGT CCTTGAAGGA CATGCAGAAC GCCGCCGAGA CGCGCGTCAA CAAACTGCTC 
GATTCGGTGC GCTGA

Protein sequence

MKMTSHLAAI GLLACAAGSA LAQARTEITL ARFFGSCEAD YGKSIDVKAA RGECGIITTL 
VNKFNATNKD NIVVKPQIVE WGPYYDQLTA RIVARDVPTI AVMHESSLGD FVHRKLIEPM 
DDSFKSVGID TAQFSDQARA GTSFSGKTYA LPFDTHAWLW HFNLNLMKKA GLTKPDGSPV 
IPGSPEELFA QARQFKQATG KPYFAWQTVN SSASYMRTFL TLLYQQNGAK LFTDGAKPRI 
DMKSPQATKA LKLMNQIYSE GLVMTGLDYG PSNQAFVNGE VGVVVVGTWK IDDFVAQAEK 
ADTPLAKGYA VYPFPQLFDQ KAVCADGHSW VMLKGGAKDE ASRKAALAFL KFIWDNDVEW 
ARTGHLPISK LTLSSPGFKA LPMRSNIAEI SASGRGIPLS IPRQRAIQIA VDQEIGNMLT 
SKKSLKDMQN AAETRVNKLL DSVR