Gene Dvul_0956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_0956
Symbol
ID	4662522
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	+
Start bp	1174517
End bp	1175710
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	65%
IMG OID	639819179
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_966404
Protein GI	120602004
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000351359
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.276703
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAAAC TTTCCATCAG GAACCTGACC AAGATCTTCG GTCCACACCC CGAGAAGGCC 
CTCGGTCTTC TCGAGCAGGG GCTTGGCAAG GAGGAAATCC ACCGCCGCAC AAGCCATGCC 
GTGGGTGTCG ACCGTGCCTC CTTCGATGTG GAGGAGGGCG AGATCGTCGT GGTCATGGGT 
CTCTCCGGCA GCGGTAAATC CACATTGGTA CGCTGCCTCA ACCGCCTCAT CGAACCCACG 
GCCGGAACCG TCACCGTCGA CGGCCGGGAC GTGACCTCCA TGCCCGTCGA CGAGTTGCGA 
CGCCTTCGGC AACGCAGCTT CGGGATGGTC TTCCAGAACT TCGCCCTCTT CCCGCACCGT 
ACTGTGCTGC AGAATGCCGC CTTCGGCCTA GAGGCCATGG GCGTGCCCCG TGCCGAACGC 
GAGCGTCAGG CCATGGTCTC GCTCGAAAGG GTGGGGCTCG CAGAGTGGGC CGCATCGCGT 
CCCGCGCAGC TGTCCGGGGG CATGCAACAG CGTGTGGGGC TTGCAAGGGC CCTTTCCCTC 
GACCCCGACA TCCTGCTCAT GGACGAGGCG TTCAGCGCGC TCGACCCACT CATCCGGCGT 
GACATGCAGG ACGAACTGCT GCGGTTGCAG GACGACCTGC AGAAGACCAT CGTGTTCATC 
AGTCATGACC TCGACGAGGC CCTCAAACTG GGTGACCGCA TCGTGCTCAT GCGCGACGGG 
GCGGTGGTGC AGATAGGCAC ACCCGAGGAC ATCCTCACCA ATCCTGCCGA CGACTATGTC 
GCCCGCTTCG TGGGCGAGGC CGATGTGACC AAGGTGCTCA CGGCTGGCAG CGTCATGAAG 
CGCTCCGAAG CCGTGGCGGT GCTCGGCATA GACGGCCCCC GCACCGCCCT GCGCAAGATG 
CGGCGTAACG CCATCGCAAC GCTCTTCGTG CTGGACGAAC GGCACAGGCT GGTGGGGCTC 
ATCACCGCAG ACGATGCGGC GCGCCTCGCC GCCGAGGGCG TACGCGAGCT TGGTTCCATC 
GTCAGACGTG ACATCGCCAC GGTTCCACCA GAAGCCCCGG CTACGGAACT CATATCCCTC 
ATGGCAGACC TGCCGCATCC GCTGGCTGTC GTGGACGAAC GTGGCAGGCT GGCTGGCGTC 
ATCGTTCGCG GTCTGCTGCT GGGGGCGCTT GCCGAACGCG GAGGTGTCGC ATGA

Protein sequence

MSKLSIRNLT KIFGPHPEKA LGLLEQGLGK EEIHRRTSHA VGVDRASFDV EEGEIVVVMG 
LSGSGKSTLV RCLNRLIEPT AGTVTVDGRD VTSMPVDELR RLRQRSFGMV FQNFALFPHR 
TVLQNAAFGL EAMGVPRAER ERQAMVSLER VGLAEWAASR PAQLSGGMQQ RVGLARALSL 
DPDILLMDEA FSALDPLIRR DMQDELLRLQ DDLQKTIVFI SHDLDEALKL GDRIVLMRDG 
AVVQIGTPED ILTNPADDYV ARFVGEADVT KVLTAGSVMK RSEAVAVLGI DGPRTALRKM 
RRNAIATLFV LDERHRLVGL ITADDAARLA AEGVRELGSI VRRDIATVPP EAPATELISL 
MADLPHPLAV VDERGRLAGV IVRGLLLGAL AERGGVA