Gene Dvul_1964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1964
Symbol
ID	4663469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	+
Start bp	2281683
End bp	2282804
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	63%
IMG OID	639820205
Product	histidinol-phosphate aminotransferase
Protein accession	YP_967407
Protein GI	120603007
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCAC CAAGCATGAG CAGGCCGGAC GATGTGCGGC CAGAAGTGCT CGACTTCAAG 
CCCTACGTTC CGGGCTTGTC CATCGACGAG ATACGCGACC GCTTCGGACT CGCCGACGTG 
GTGAAGCTGG CAAGCAACGA AAACCCCCTC GGCACTTCGC CCGTCGTGCA GCGTACCCTC 
AAGACCAAGG CCGACCTCGC CTTCCGCTAC GCGCAGTCGG GCAACCCCCG CCTCACGCGT 
GCCATTGCCG CCCATCATGG TGTCGCGCCG GAACGTGTCG TGGCGGGCAA CGGTTCAGAC 
GAGATCATCG ACCTGCTCAT CCGCGTGCGC GCCACCCCCG GCAAGCACAA CATCGTGGCC 
TTTCGCCCGT GCTTCAGCAT CTACGAGCTT CAGGCGAAGT TCTGCGGTCT GGAATTCCGG 
CAGGCCGACC TGCGACCCGA TTTCACCTTC GACTGGGACG CCTTCCTCGC CGCCACGGAT 
GAGAACACCG CCATCGCCTT CGTGACCACC CCCGACAACC CCTCCGGCTG GTGTCCGCCG 
GTGTCTGAAC TTGAACACGT CGCCCGCACA CTGCCCCCGT CGTGCCTCTT CGTCATCGAT 
GAGGCGTACA TGGATTTCTG CGGCGACGAA GCCGCGCATT CGCTGCTTTC TCGGCTTGAC 
GCCTTCCCCA ACATCGCGGT GCTACGCACC TTTTCCAAGA GCTTCGGGCT TGCGGGACTT 
CGCCTCGGCT ACGGCATCCT CCCGGAACGT CTGGCTGACT ACCTGCACCG GGTACGACTG 
CCGTTCAGCG TGAACATCCT CGCCGAAGAA GCGGGACTTG CCGCCCTTGA GGATACTGTG 
TTCAGAAGCG AGACCCTTCG CGTCACCGCC GAAGGCCGTG CATACATCGC CGAAGGACTG 
ACGGCACTGG GGTGCGAGGT CCTGCCTTCG TGGGCCAACT TCATCATGTT CCGACCGCCC 
ACGGATGCAA CCGACCTCTT CGAGGCGCTT CTGCGGCGCG GCATCATCAT CAGACCCCTC 
AAAAGCTATG GCCTGCCCCA ACACCTGCGG GTGAGCATGG GCAACGCCGA CGAGAACAGA 
CGTTTCATAG CAGCCTGCAA GGAGATTCTG CCTCATGCCT GA

Protein sequence

MTAPSMSRPD DVRPEVLDFK PYVPGLSIDE IRDRFGLADV VKLASNENPL GTSPVVQRTL 
KTKADLAFRY AQSGNPRLTR AIAAHHGVAP ERVVAGNGSD EIIDLLIRVR ATPGKHNIVA 
FRPCFSIYEL QAKFCGLEFR QADLRPDFTF DWDAFLAATD ENTAIAFVTT PDNPSGWCPP 
VSELEHVART LPPSCLFVID EAYMDFCGDE AAHSLLSRLD AFPNIAVLRT FSKSFGLAGL 
RLGYGILPER LADYLHRVRL PFSVNILAEE AGLAALEDTV FRSETLRVTA EGRAYIAEGL 
TALGCEVLPS WANFIMFRPP TDATDLFEAL LRRGIIIRPL KSYGLPQHLR VSMGNADENR 
RFIAACKEIL PHA