Gene Dvul_2397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_2397
Symbol
ID	4664088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	2794966
End bp	2796084
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	62%
IMG OID	639820645
Product	extracellular ligand-binding receptor
Protein accession	YP_967840
Protein GI	120603440
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.285564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.778884
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAAAG GTTGGTTCAA GGCGCTCATC GCGGGAATGA CCGTCGCGGT CATGGCTGGT 
CCGGTCTTCG CCGGTGACAC CATCAAACTG GGCGTGCCCG GCGCACACAG TGGCGACCTG 
GCCTCTTACG GCCTGCCCTC TGCCAACGCC GCCAAGATTG TCGCCAAGAT GTTCAACGAC 
AAGGGCGGCA TCAACGGCAA GATGGTCGAA GTCATTCCGC AGGACGACCA GTGCAAGCCT 
GAAATGGCCA CCAACGCGGC CACCAAGCTC GTCTCCGACG GCGTGGACAT CGTGCTGGGT 
CACATCTGTT CCGGCGCCAC CAAGGCCGCG CTGCCCATCT ACAAGGAAGC CAACAAGGTC 
GTCATGTCGC CTTCGGCCAC CACGCCTGCG CTCACCCAGA GCGGCGACTA CCCCATGTTC 
TTCCGCACCA TCTCCTCGGA CGACCAGCAG GCGAAGCTGG GCGTCGATTT CGCCATCGAC 
AAGCTCGGTG CCAAGAAGAT CGCCGTGCTG CATGACAAGG GCGACTACGG CAAGGGCTAC 
GCCGAGTACG CAAAGCAGTT CATCGAGCAG AGCGGCAAGG CCACCGTCGT GCTGTTCGAA 
GGCGTGACCC CCGGTGCCGT GGACTACAGC GCCGTGGTGC AGAAGGTGCG CAGCGAAGGT 
GCCGACGCAG TCATGTTCGG CGGCTACCAT CCTGAAGCCT CGAAGATCGT CGCCCAGATG 
CGCAAGAAGC GTATGACTAC TCCCTTCATC TCCGACGACG GCGTGAAGGA CGACACCTTC 
ATCAAGGTCG CCGGCAAGGA CGCCGAGGGC GTGTACGCCT CCAGCTCCAA GGACGTGAGC 
ATGCTGCCCA TGTACAAGGA AGCCATCGAA CTGCACAAGA AGGAGTTCGG CACTGAACCC 
GGCGCGTTCT ACAAGGAAGC CTTCGCCGCT GCGCAGGCCC TTCTTACCGC CGTGCAGCGT 
GCAGGCAGCA CCGAAACCCC CAAGGTTGTC GACGCCCTGC GTAACAACTT CGTCGAGACC 
GCCATCGGCA AGATCAAGTT CGACAAGCGT GGCGATGCCG AAGGTACCGG CTTCTCCATG 
TATCAGGTCA AGAACGGCGT GTACGTCGAG CTGAAGTAG

Protein sequence

MRKGWFKALI AGMTVAVMAG PVFAGDTIKL GVPGAHSGDL ASYGLPSANA AKIVAKMFND 
KGGINGKMVE VIPQDDQCKP EMATNAATKL VSDGVDIVLG HICSGATKAA LPIYKEANKV 
VMSPSATTPA LTQSGDYPMF FRTISSDDQQ AKLGVDFAID KLGAKKIAVL HDKGDYGKGY 
AEYAKQFIEQ SGKATVVLFE GVTPGAVDYS AVVQKVRSEG ADAVMFGGYH PEASKIVAQM 
RKKRMTTPFI SDDGVKDDTF IKVAGKDAEG VYASSSKDVS MLPMYKEAIE LHKKEFGTEP 
GAFYKEAFAA AQALLTAVQR AGSTETPKVV DALRNNFVET AIGKIKFDKR GDAEGTGFSM 
YQVKNGVYVE LK