Gene Veis_4044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_4044
Symbol
ID	4694163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	4433010
End bp	4434047
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	64%
IMG OID	639851791
Product	extracellular solute-binding protein
Protein accession	YP_998767
Protein GI	121610960
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAACC AATGCCTGCT CGCCTGCGCC GCCCTGTGTG CCGGCATGGC CCTGCCCGGT 
CTGGCGCAGC AGTCCATCAC CGTCGTGAAC TTTGGCGGCG CCGCCGCCAA CGCCCAGAAG 
AAAGCCTATT ACGAGCCTTA CGAGAAGCAG ACCGGCAGCA AGATCGTGGC GCTGGAGTAC 
AACGGCGAGC AGGCCAAGCT CAAGGCCATG GTCGAGGCCA AAAAAGTCAC TTGGGATGTG 
CTCGAAGTCG AGACCCCCGA CGCCGTGCGC GGCTGCGATG AAGGGCTGTT CGAGAAGATC 
GACTACAGCC GGATCGCCAG CAAGAACGAG CTGATGCCTG ACGCCATCAC CGACTGCGCC 
GTGGGTTTCC TGGTGTGGTC GACCGTGATG GCCTACAACG GCGACAAGCT CAAGACCGCC 
CCCGGCGGTT GGGCCGACTT CTTCGACACG CAAAAGATTC CCGGCAAGCG CGGCATGCGC 
AAGGGCGCCC GCTACAACCT CGAATTTGCG CTGCTGGCCG ATGGCGTCAA GCCCGCCGAT 
GTGTACCCGC TGCTGGCCAC CCGGGAGGGC GCCGACCGGG CCTTCAAAAA GCTCACCGCG 
CTCAAGCCCC ATATCCAGTG GTGGGCCGCC GGCGCGCAGG TGCCGCAGTT CCTGGTGGCC 
GGCGATGTGG TGCTGAGCAC GGCCTACAAC GGGCGCATCG ACGCGGCCAA CCGCGAAGGG 
CGCAACCTTC GCATCCATTG GCCCGGCAGC ATCTACGACC TGGAATACTG GACCATCCCC 
AAAGGCGCGC CGAACAAGGA TGAGGCGCTG AAATTCATCG CCTTCAGCCT GCAGGCCGAC 
AACCAGGCGG TGTACGTGCG GCAAATCGCC TATGGCCCGA CCAACACCAA GGCCATGGCC 
CAACTCGACG CAAAGACCCT GGAACGACTG CCCACCTCGG CCAACAATGC CCGGCAAGCG 
CTGCGGTTCG ACGTGGGTTT CTGGGCCGAC CAGGGCGAGA TGCTGGAAAA GCGCTTTGCC 
GTCTGGGCCA CACAGTGA

Protein sequence

MKNQCLLACA ALCAGMALPG LAQQSITVVN FGGAAANAQK KAYYEPYEKQ TGSKIVALEY 
NGEQAKLKAM VEAKKVTWDV LEVETPDAVR GCDEGLFEKI DYSRIASKNE LMPDAITDCA 
VGFLVWSTVM AYNGDKLKTA PGGWADFFDT QKIPGKRGMR KGARYNLEFA LLADGVKPAD 
VYPLLATREG ADRAFKKLTA LKPHIQWWAA GAQVPQFLVA GDVVLSTAYN GRIDAANREG 
RNLRIHWPGS IYDLEYWTIP KGAPNKDEAL KFIAFSLQAD NQAVYVRQIA YGPTNTKAMA 
QLDAKTLERL PTSANNARQA LRFDVGFWAD QGEMLEKRFA VWATQ