Gene Veis_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_2044
Symbol
ID	4691498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	2320127
End bp	2321203
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	66%
IMG OID	639849808
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_996812
Protein GI	121609005
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.707301
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCCGGC AAGGCCCCCG GCAATACCCC CCCCGAAAAA CCATCCCCCA ACCCAAGGAG 
CACGAGTTGA AAACCATCAT CCGACTGGCC GCGCTGGCGC TGGCGCTGTC CCTGTCCGCC 
ACCGGGCCTG CGCTGGCCCA GCAGGCCAAG AAAACCTGGA AGGTCGGCGC TGCGGTGTAC 
GGCCTGAAGG CCGAATTCGC GCAGCTATGG GTGAATGCGC TGAAAAAGCA CCCGCTGGTC 
AAGGACGGCA CCGTCAAGCT CACGGTGTTC GACGGCAAGT ACGACGCGCT GACGCAGAAC 
AACCAGTTCG AGACCATGAT CACGCAAAAG TACGACGGCA TCCTGTTCGT GCCGATCGAC 
CTGCAGGCCG GCGCCGATGC GGTGTCCAAG GCGGCCGAGG CGAACATCCC GGTGGTCGGC 
TCCAACGGCC GCGTCAACAG CGACAAACTG CTGTCGTATG TCGGCTCGAA CGACGTGATC 
GCCGGCGCCA TGCAGGCGCA GGCGGTCGTC GATGCGATGG GCGGCAAGGG CAACGTGGTG 
ATCCTCGAAG GCCCGATCGG GCAGTCGGGG CAGGTCGAGC GGCGCCAGGG CAACCTGAGC 
GTGCTGGCCA AATACCCGAA CGTGAAGGTG CTGGAAATGA AAACCGCGAA CTGGTCGCGC 
GCCGAGGCGC TGTCGCTGAC CGAGAACTGG CTCACCGCGC ATGCCGGCAA GATCAACGGC 
ATCATCGGCC AAAACGACGA GATGGCGCTC GGCGCAATCG AGGCGGTCAA GGCCAAGGGG 
CTGGACCCCA AGACCATTCC GACCGCCGGC ATCGACGGCG TCAGTGATGC AGTGCGCGCG 
GTCAAGGCCG GCATCATGGC CAGCGTGCTG CAAGACGCCA GCGCGCAGTC CCAGGGGGCG 
CTCGACGTGC TGCTGCGCAA GCTGATCGGC GCCAGCTACA AGCCGCGCTC GGCCATGTGG 
GCGCAGTACG GCGCGGCCGG CCTGCAATGG GACGACGGCG CGGCCCGGGC CTACAACATC 
CCGTGGACCC CGATCACGCT GCAAAACGCC GACGCGCTGC TGGCGCAACG CAAATGA

Protein sequence

MSRQGPRQYP PRKTIPQPKE HELKTIIRLA ALALALSLSA TGPALAQQAK KTWKVGAAVY 
GLKAEFAQLW VNALKKHPLV KDGTVKLTVF DGKYDALTQN NQFETMITQK YDGILFVPID 
LQAGADAVSK AAEANIPVVG SNGRVNSDKL LSYVGSNDVI AGAMQAQAVV DAMGGKGNVV 
ILEGPIGQSG QVERRQGNLS VLAKYPNVKV LEMKTANWSR AEALSLTENW LTAHAGKING 
IIGQNDEMAL GAIEAVKAKG LDPKTIPTAG IDGVSDAVRA VKAGIMASVL QDASAQSQGA 
LDVLLRKLIG ASYKPRSAMW AQYGAAGLQW DDGAARAYNI PWTPITLQNA DALLAQRK