Gene Veis_3573 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_3573
Symbol
ID	4693351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	3950715
End bp	3951959
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	64%
IMG OID	639851328
Product	extracellular solute-binding protein
Protein accession	YP_998309
Protein GI	121610502
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0138682
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAC ACATTCTGGG ACTGGCCATC ACCGCCGCCT GCGCGCTGCC TGCGGCCGCG 
CAGCAAAGCG TCGAGGTGCT GCACTGGTGG ACCGCCGGCG GCGAAGCCGC CGCGCTGAAC 
GTTCTCAAGG GCAACCTGGA AAAGCAAGGC GTCAAGTGGA ACGACATGCC GGTGGCCGGC 
GGCGGCGGGG AGGCGGCGAT GACCGTGGTG CGCGCGCGCG TGACCGCCGG CAACCCGCCC 
ACCGCCGTGC AAATGATGGG CTTCGACCTG CTCGACTGGG GCCGGCAAGG GGTTCTGAGC 
GACCTCAACG AACTGGCCAC CAAACAGGGC TGGGACAAGG TGGTGCCGCC TGCGCTGCAA 
AAGTTCTCGA AGTTCAACGG CAAGTGGATT GCGGTGCCCG TGAACATACA CTCGACCAAC 
TGGGTCTGGG CGAACAAGGA GGTGCTGGCC AAGGCCGGCG TCACCAGCGA CCCCGGCCAC 
TGGACTTGGG ATGACTTCAT CGCCGCCGCG CAGCAGGTGC AAAAAGCCGG CTTCATCGCC 
ATCGCTCACG GGGGCCAGCC CTGGCAGGAA GCCACGGTAT TCGACGGCGT GGCGCTGTCC 
ACCGGTGGCG CCGACTACTA TCGCCGGGCC TTGATCGAAC TCGACGGCAA GGCGCTGAAT 
TCGCCGACCA CCGAGAAGGT CTTCGAGCGC ATGGCGCAAC TGCGCAAACT GGTCGACAAG 
GACTTTTCCG GCCGTGACTG GAATGTGGCC TCCGGCATGG TGATCAGCGG CAAGGCCGGT 
TTTCAGTTGA TGGGCGACTG GGCCAAGGGC GAATTCATCA CCGCCAAGAA ACTGCCCGGC 
AAGGATTTCC TGTGCTTTCG CACCCCCGGC ACGCAGGGGA GCGTGACCTT CAACGCCGAT 
CAGTTTGCAA TGTTCAAGGT CGGCGCCGAC AAGGTCGCGG CCCAGTCCTT GCTGGCCAGC 
GCCATCATGG AACCGGCATT CCAGTCGACG TTCAACGTCG TCAAGGGCTC CGTTCCGGCC 
CGCACCGATG TGCCCGACAC CGCTTTCGAT GCCTGCGGCA AAAAGGGCAT GAAGGACCTG 
GCCGAGGCGA GCAGCAAAAA CCAACTGCTC GGCTCCATGG GCCATGGCTA TGCGGTGCCG 
GCGTCGATCA AGAACGCCTT TTATGACGTC ATCACGCGGC ACTTCAATGG CCAGATCGAC 
AACAAGAAGG CGGTCGCAGA AATGGCTGCG GCGGCCAAGG ATTGA

Protein sequence

MKKHILGLAI TAACALPAAA QQSVEVLHWW TAGGEAAALN VLKGNLEKQG VKWNDMPVAG 
GGGEAAMTVV RARVTAGNPP TAVQMMGFDL LDWGRQGVLS DLNELATKQG WDKVVPPALQ 
KFSKFNGKWI AVPVNIHSTN WVWANKEVLA KAGVTSDPGH WTWDDFIAAA QQVQKAGFIA 
IAHGGQPWQE ATVFDGVALS TGGADYYRRA LIELDGKALN SPTTEKVFER MAQLRKLVDK 
DFSGRDWNVA SGMVISGKAG FQLMGDWAKG EFITAKKLPG KDFLCFRTPG TQGSVTFNAD 
QFAMFKVGAD KVAAQSLLAS AIMEPAFQST FNVVKGSVPA RTDVPDTAFD ACGKKGMKDL 
AEASSKNQLL GSMGHGYAVP ASIKNAFYDV ITRHFNGQID NKKAVAEMAA AAKD