Gene Veis_3969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_3969
Symbol
ID	4694310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	4354484
End bp	4355434
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	61%
IMG OID	639851718
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_998694
Protein GI	121610887
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.277601
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTGA AAAAATTTGC TGCATTCGGG TGTGCGGCCT TGCTTGTTGC GTGGTCGAGC 
CCATCATTTG CCGAGCCGGA GCCGGCGAGT TGCCGCAATC TGCGTTTTGC CGACAACGGC 
TGGACCGACA TCACGTCGGT GACCGCGCTG GCTTCGGTGG TCTTCGAGGC GCTCGGCTAC 
AAGCCAAGCA CGACGATGGC GTCGGTGCCC ATCTCGTTTG CCGGTCTGAA GAACAAGCAG 
CTCGATGTAT CGCTGGGCTA CTGGTGGCCG CTGCAGCAGT TGCAGGTTCA GCCGCTCCTC 
GACAGCAAGT CGATCAACAT GATCGAACCG CCCAACCTGT CCGGCGCCAA GGCGACGCTT 
GCGGTGCCAG GCTACGCTTG GGCAGCCGGC CTGAAGTCGT TCGACGATAT CGCCCGGTAC 
CGCAAGGAGC TCGACGGCAA GATCTACGGG ATCGAGTCGG GCAGCAGTGC CAATGCGAAG 
ATACAAAAGA TGATCGACCA GAACCTGCAC GGGCTTGGCG GCTTCAAGTT GGTCGAGTCC 
AGCGAGGCCG GGATGCTGGT CACGCTCGAG CGTGCGATCC GCAACCAGAA GTGGCTCGTG 
TTCTGGGGTT GGGAGCCGCA TCCGATGAAT ATCCAGTTCA GCATCAATTA CCTGTCGGGC 
GGCGATGCGA CGTTCGGCCC CAACTACGGC GAGGCGCGCG TCTATACGCT GACCGCGACC 
GATTTTCTTG AGCGCTGCCC CAACGCCGGC AAACTGGTCA CGCAGTTGCG CTTCTCGACG 
CAGTTGGAGA ACCAGCTGAT GCAGGCGGTG ATGAACAAAA CCAGGCCGGC TGAGGCTGCG 
CGTGCGTATC TGAAGCAAAA TCCCCAGGTG CTCGATCCGT GGCTTGCGGA CGTGAAGACC 
TTCGATGGCA AGGATGGACT GGCGGCCGCG AAAGCGCAGC TCGGTCTGTG A

Protein sequence

MALKKFAAFG CAALLVAWSS PSFAEPEPAS CRNLRFADNG WTDITSVTAL ASVVFEALGY 
KPSTTMASVP ISFAGLKNKQ LDVSLGYWWP LQQLQVQPLL DSKSINMIEP PNLSGAKATL 
AVPGYAWAAG LKSFDDIARY RKELDGKIYG IESGSSANAK IQKMIDQNLH GLGGFKLVES 
SEAGMLVTLE RAIRNQKWLV FWGWEPHPMN IQFSINYLSG GDATFGPNYG EARVYTLTAT 
DFLERCPNAG KLVTQLRFST QLENQLMQAV MNKTRPAEAA RAYLKQNPQV LDPWLADVKT 
FDGKDGLAAA KAQLGL