Gene Veis_4059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_4059
Symbol
ID	4694315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	4452545
End bp	4453582
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	65%
IMG OID	639851806
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_998782
Protein GI	121610975
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0780892
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.409572
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAAGCC CGAAAATCAG CGTCAAAAAT CTCTACAAGG TCTTTGGCAG CAACCCCTCG 
CAAGCCATCC GACTGCTCGA CGAAGGGCGC AGCAAAGACG AGATTTTTGC CCAGACCGGG 
CAGGTGGTGG GCATCAACAA GGTCAGCTTC GACGTGCTGG CCGGCGAAAT TTATGTGCTG 
ATGGGCTTGT CAGGCTCGGG CAAATCGACC CTGATCCGGC TGATCAACCG ACTGGTCGAA 
CCGTCCTGCG GTTCGATCAA CATCGACGGG CTGGACATCG CCGCGCTGTC GCAGGCCGAA 
CTGGTCAAGT GGCGCCGCAA ACGGGTGGCG ATGGTGTTCC AGTCGTTTGC GCTGATGCCG 
CACCGCAATG TGCTGTCCAA CACCGCCCTC GGGCTGGAGA TGGCCGGCAC GCCGCGCCAG 
CAGCGCGAAG CCCGCGCCAT GGAGGTGCTG GCCCAGGTCG GCCTGCAAAC CTACGCCGCC 
AAATACCCGG CGCAACTGTC CGGCGGCATG CAGCAGCGCG TCGGGCTGGC CCGGGCTTTG 
GCGGTGGACC CCGACATCCT GCTGATGGAC GAGGCCTTCT CGGCGCTCGA TCCGCTCAAG 
CGGGTCGAAA TGCAAAGCCT GCTGCTCGAC TTGCAGCGCG AGCAGCAGCG CACCGTGCTG 
TTCGTCTCGC ACGACCTGGA GGAGGCGCTG CGCATAGGCA ACCGCATCGC CATCATGGAA 
GGCGGCAACC TGGTGCAGGA AGGCACGGCC CACCAGATCA TCACCGAGCC GGCCAACGCC 
TACGTGCGCA AATTCTTCGA AGGCGTGGAC ACCTCGCGCT ATCTGACGGC GGCAGACCTG 
CTCGACCCCC GGCTCAACGG CCACTCCTGG GACGGCGGTG CGCGCCTGTC CTGGTCGACG 
CCGTTGCCCG AAGCGATGAA GATCGTGCTC GACAGGGACC AGCCGATCGG CGTCTTCGAT 
GCCAGCGACC GCTTGCTCGG CTGCATCTCC GCGCGCAGCC TGCTCGACAG AATGTCCCGG 
GAGGCACGCC ATGTCTGA

Protein sequence

MSSPKISVKN LYKVFGSNPS QAIRLLDEGR SKDEIFAQTG QVVGINKVSF DVLAGEIYVL 
MGLSGSGKST LIRLINRLVE PSCGSINIDG LDIAALSQAE LVKWRRKRVA MVFQSFALMP 
HRNVLSNTAL GLEMAGTPRQ QREARAMEVL AQVGLQTYAA KYPAQLSGGM QQRVGLARAL 
AVDPDILLMD EAFSALDPLK RVEMQSLLLD LQREQQRTVL FVSHDLEEAL RIGNRIAIME 
GGNLVQEGTA HQIITEPANA YVRKFFEGVD TSRYLTAADL LDPRLNGHSW DGGARLSWST 
PLPEAMKIVL DRDQPIGVFD ASDRLLGCIS ARSLLDRMSR EARHV