Gene Dvul_1219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1219
Symbol
ID	4664529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	+
Start bp	1497522
End bp	1499111
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	61%
IMG OID	639819451
Product	NifA subfamily transcriptional regulator
Protein accession	YP_966666
Protein GI	120602266
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID	[TIGR01817] Nif-specific regulatory protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.832328
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.664037
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAAT CGATCCAGAC CGACGACAGG CGTCTGCAAC CCTATCTGGG AACGCTTCAG 
AAGATCGTAT CGGAGATGGG CCCGCAACGG CCCTTCCAGT CGACCCTGAA GTCGTTGCTG 
CACACCCTTG CCGAGAACCA CGATTTCAAG CGTCCGCACA TCGTCATCTT CGACCCTGAG 
ACGCGGACGC TGAAGTTGAG CCTCACCGAT ACCCCTGCCA AGGCACAGAA TGCCGAGTAT 
GAGCCCGGTG TCGGTGTCAC GGGGCAGGTG TTCGCCTCGG GCCAGCCTGT CGTCGTGCCC 
TGCATGAAGG AGCATCCGGC GTTCCTGAAC AAGATGTTCG GCCGTTCCGA AGAGGAGTTG 
GCGACGTTGG CGTTCATCTG CGTCCCCGTG CTCGGCCCCA GCGACGAACC TCGCGAAGGG 
CGCGAAGTCA TCGGCACACT GAGTGTGGAT ACGCCCAACA CGTCGCACGC GCAGCTTGAG 
GCGCATTGCC GTTTCCTTGA AGTTGTGGCG GGTATGATCG CCAACCATGC CGCCTACATG 
CAAGAGGAGA TGGCGCGCCA GAAGCACCTC ATGACGCAGG GGCTCATCGT CGGTGATACG 
GGCGAGGGTA CGTTCAACCC CGCCAATATC GTCGTGGCGT CCAAGACCAT GCGGCTGGTG 
CTCAATCAGG CTGCGCAGGT CGGGCCCAGC AGGGCCACCG CGCTTCTGCG CGGTGAGTCG 
GGCACAGGCA AGGAGCTTCT GGCCGAGGCC ATTCATCAGG CCAGCCCCCG TCGTGATATG 
CCGCTCATCA AGCTCAATTG CGCGGCCCTT CCTTCGGAAC TGGTCGAGAG TGAGCTCTTC 
GGCTACCAGA AGGGGGCGTT CACCGGGGCG ATACAGACCA AGAAGGGCCT GTTCGAACTG 
GCGCACAAGG GTACGCTCTT CCTTGATGAG GTTGGCGAAC TCAGTCCCTC GGCGCAGGCG 
AAGGTGTTGC GTGCCATTCA GGAGCAGGAG ATTCAGCGTC TCGGCAGCGA GCAGACCATC 
CTTGTCGACG TGCGCCTCAT CTGCGCCACG CACCAGCCTC TGGAAGAACT GGTGGAGAAG 
GGGCTGTTCC GCGAAGACCT CTACTATCGC ATCAACGTCT TCCCCATCTT CATACCGCCC 
CTGCGTGAGC GGCGTGAAGA CATCCTGCCC ATCGCCGAGC ACTTCTTGCG CATGTACGCG 
GAAGAATACT CGAAGAGCAT CAAGCGCATC TCGACGCCTG CCATCGACCT GCTGACGCAG 
TACCACTGGC CCGGCAACAT CCGGGAACTC AAGAACTGCA TCGAACGGGC GGTGCTGGTG 
TGCGACGAAC AGGTCATCCG CACCTACCAT ATGCCACCTT CGTTGCAGAC AGCCGAAAGC 
ACGGCCACAG ACACCAATCT CTCATTCTGC GAGGCTGTGG CCAAGTTCGA GCAAGAGCTT 
CTGGTGGATG CGCTCAAGAA GGCCCGCGGC AACATGTTGC AGGCGGCACG CGACTTGCGC 
GTCAGCTACC GTATCGTGAA CTACAAGGTG AAGAAGTACG GTCTCGATGC CAAGAAGTTC 
GCCGTGGCGA AGGCGCGCGG CATGAAATAG

Protein sequence

MTQSIQTDDR RLQPYLGTLQ KIVSEMGPQR PFQSTLKSLL HTLAENHDFK RPHIVIFDPE 
TRTLKLSLTD TPAKAQNAEY EPGVGVTGQV FASGQPVVVP CMKEHPAFLN KMFGRSEEEL 
ATLAFICVPV LGPSDEPREG REVIGTLSVD TPNTSHAQLE AHCRFLEVVA GMIANHAAYM 
QEEMARQKHL MTQGLIVGDT GEGTFNPANI VVASKTMRLV LNQAAQVGPS RATALLRGES 
GTGKELLAEA IHQASPRRDM PLIKLNCAAL PSELVESELF GYQKGAFTGA IQTKKGLFEL 
AHKGTLFLDE VGELSPSAQA KVLRAIQEQE IQRLGSEQTI LVDVRLICAT HQPLEELVEK 
GLFREDLYYR INVFPIFIPP LRERREDILP IAEHFLRMYA EEYSKSIKRI STPAIDLLTQ 
YHWPGNIREL KNCIERAVLV CDEQVIRTYH MPPSLQTAES TATDTNLSFC EAVAKFEQEL 
LVDALKKARG NMLQAARDLR VSYRIVNYKV KKYGLDAKKF AVAKARGMK