Gene Dvul_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1031
Symbol
ID	4663944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	1264207
End bp	1265484
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	62%
IMG OID	639819255
Product	aromatic amino acid transporter
Protein accession	YP_966478
Protein GI	120602078
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0814] Amino acid permeases
TIGRFAM ID	[TIGR00837] aromatic amino acid transport protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACAGT GCATGACAGC CAACGGGCAG ACCGCCACGC AAGCCGGGGT GAAGAATCCC 
TCGGTTCTTG GCGGCGCCAT GATCATAGCC GGGACGACCA TCGGCGCGGG CATGTTCTCG 
CTGCCGAGCG TCTCTGCCGG CATGTGGTTC TTCTATTCCC TCTTCGTCCT GTTCGGCACG 
TGGCTTTGCA TGTGCCATTC CGGCCTGATG ATTCTCGAGG CCAACCTCAA CTATCCCGCC 
GGGACATCCT TCGACAACAT CGCCAAGGAC TGCCTTGCCA GACCCGTGCG GCTGCTGAAC 
AGCCTCTCGG TGGCCTTCGT GCTCTACATT CTCACCTACG CCTATATCAG CGGCGGCGGG 
TCCATCGTCG CGCATACGGT GAAGGCGGCT GTGGGCATCG ACGTTCCCAT GAAGCTGGGC 
GGCTTCCTCT TCGCGCTTGT GCTCGCGTTC GTCGTATGGC TGAGCACCCG CGCCGTCGAC 
CGCATCTCCA CCATCATGCT CGGCGGCATG ATACTCACCT TCTTCTCGTC GGTGAGCGGC 
CTCATGTTCA ACGTGCAGCC TGCTGTGCTC TTCGACACCG GCGACACCAG TGCGCCATAC 
TCGCCCTTCA TCCTCGCCAC GCTTCCCTAC TTTCTCACCT CGTTCGGGTA CCACGGCAAC 
GTCCCCGGAC TCGTGAAGTA CTACAACAAG GACCCGAAGG CCGTCGCCAA GACCATCATC 
TACGGCAGCT TCCTCGGCCT CATTCTCTAC GTGTGCTGGC AACTCAGCGT ACTGGGCAAC 
ATCCCGCGCG AGGAATTCCT CGACATCGTC GCCAAGGGCG GCAACATGGG CATCCTCGTG 
GGGGCGCTGT CCAAGGTCAC AGGCAGCACC AACCTCGACT ACCTGCTCCA GGTCTTCTCG 
CATCTTGCCG TGGCGACCTC GTTCCTCGGC GTGACGCTTG GCCTGTTCGA CTGCATCGCC 
GATACGCTCG GCTTCGACGA CTCGCGTCTC GGACGTACCA AGACCGCCAT CGTCACCTTC 
GTGCCCCCGG CCATTGGCGG CCTGTTCTAC CCCGACGGAT TCATCATGGC CATCGGCTTT 
GCCGGGCTTG CAGCCACCGT GTTCGCTGTC ATCGTACCCG CCATGATGGC ACTGGCCACA 
CGCAGGAAGT TCGGCAACAC CACCTACCGC GCCCCCGGCG GCAACGTGAT GCTCTATGTG 
ACCATCGCCT ATGGCATCAC AGTGGCCATC TGCCATGTGC TGACCATGTT CGACACGCTG 
CCTGTCTACG GCAAGTAG

Protein sequence

MSQCMTANGQ TATQAGVKNP SVLGGAMIIA GTTIGAGMFS LPSVSAGMWF FYSLFVLFGT 
WLCMCHSGLM ILEANLNYPA GTSFDNIAKD CLARPVRLLN SLSVAFVLYI LTYAYISGGG 
SIVAHTVKAA VGIDVPMKLG GFLFALVLAF VVWLSTRAVD RISTIMLGGM ILTFFSSVSG 
LMFNVQPAVL FDTGDTSAPY SPFILATLPY FLTSFGYHGN VPGLVKYYNK DPKAVAKTII 
YGSFLGLILY VCWQLSVLGN IPREEFLDIV AKGGNMGILV GALSKVTGST NLDYLLQVFS 
HLAVATSFLG VTLGLFDCIA DTLGFDDSRL GRTKTAIVTF VPPAIGGLFY PDGFIMAIGF 
AGLAATVFAV IVPAMMALAT RRKFGNTTYR APGGNVMLYV TIAYGITVAI CHVLTMFDTL 
PVYGK