Gene Dvul_2033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_2033
Symbol
ID	4662496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	2368817
End bp	2370013
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	62%
IMG OID	639820276
Product	tyrosyl-tRNA synthetase
Protein accession	YP_967476
Protein GI	120603076
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0162] Tyrosyl-tRNA synthetase
TIGRFAM ID	[TIGR00234] tyrosyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0657081
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGACA TCGACAGGCA ACTGGAGCAC ATCAAGCGGG GCTGCGCCGA ACTCATCGAC 
GAGGGTGAAC TCCGCAAGAA GCTTGAGCGG GGCACGCCGT TGCGCATCAA GGCGGGGTTC 
GACCCCACTG CGCCCGACCT GCACCTCGGG CACACGGTGC TCATCCACAA GCTGCGCCAT 
TTTCAGGAAC TCGGCCACAC CGTAATCTTC CTCATCGGCG ACTTCACCGG GCTCATCGGT 
GACCCCTCGG GTCGTTCCGA TACCCGTCCG CCGCTGACGC GCGAGCAGGT GCTCGCCAAT 
GCCGAGACCT ACAAGCAGCA GGTCTTCAAG ATTCTCGACC CGGAAAAGAC CGTGGTCGAC 
TTCAATTCGC GCTGGATGGG TGAATTCGGC GCGGCGGACT TCATCAGGCT CGCATCTCGC 
TATACCGTGG CGCGGATGAT GGAGCGTGAC GATTTCGAGA AACGCTACAA GGAAGGACGC 
CCCATCGCCG TCCACGAATT CCTGTACCCG TTGGTGCAGG GCTACGATTC CGTGGCCCTC 
AAGGCCGATG TGGAACTGGG CGGTACGGAC CAGAAGTTCA ACCTGCTCGT GGGGCGGCAT 
CTGCAGTCTC AATACGGGCA GGAGCCTCAG TGCATCCTCA CCATGCCGCT CCTCGAAGGG 
CTGGATGGCG TCAAGAAGAT GTCAAAATCC CTGGGCAACT ATGTGGGTAT CGATGAATCG 
CCCGCCGACA TGTTCGGCAA GCTCATGTCC GTCTCAGACG AACTGATGTG GCGCTACTTC 
GAACTCATCT CCTCGCGTTC CCTCGATGAA ATCGCCGACC TTCGCCGCAA GGTGGAGACG 
GGTGAGGCGC ATCCCAAGCT GGTGAAGGAG TCGCTGGCCT ACGAATTGAC CACCCGCTAC 
CATGGCGAAG ACAAGGCCGC AGAGGCACAG CAGGGCTTCA ATGCCGTATT CGCCGGTGGC 
GGCGTGCCGG ACGACGCGCC GGTGCATGCC TGCGACCATG GCGACGACAG CACCCCGCCC 
GCCTTCCTTG AAGCCGCAGG ACTCGTGAAG TCCCGTGGCG AGGCCAAGCG CCTCATCAAG 
GAAGGGGCAC TGTCTGTGGA TGGGGTACGC TGCGATGACG CCAATAGCCC CCTTGCCTCT 
GGCGAGTACG TCATCAAACT CGGCAAGAAG CGCTTCCTGC GCCTCACCGT GCGCTAG

Protein sequence

MIDIDRQLEH IKRGCAELID EGELRKKLER GTPLRIKAGF DPTAPDLHLG HTVLIHKLRH 
FQELGHTVIF LIGDFTGLIG DPSGRSDTRP PLTREQVLAN AETYKQQVFK ILDPEKTVVD 
FNSRWMGEFG AADFIRLASR YTVARMMERD DFEKRYKEGR PIAVHEFLYP LVQGYDSVAL 
KADVELGGTD QKFNLLVGRH LQSQYGQEPQ CILTMPLLEG LDGVKKMSKS LGNYVGIDES 
PADMFGKLMS VSDELMWRYF ELISSRSLDE IADLRRKVET GEAHPKLVKE SLAYELTTRY 
HGEDKAAEAQ QGFNAVFAGG GVPDDAPVHA CDHGDDSTPP AFLEAAGLVK SRGEAKRLIK 
EGALSVDGVR CDDANSPLAS GEYVIKLGKK RFLRLTVR