Gene Avin_47100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_47100
Symbol	vnfA3
ID	7763573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	4779711
End bp	4781264
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	68%
IMG OID	643807555
Product	sigma54-dependent activator protein
Protein accession	YP_002801790
Protein GI	226946717
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID	[TIGR01817] Nif-specific regulatory protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.536607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCGC ATTCGGCGAA CGCGCGTCCC GGTCGGGAAC TGCCGGTCCA GGACAAGCCC 
TGCGAATGGG ACATGGGTGA ATGCCGCACC GATCTGTTGC CGCTGCTCGG CGAACTGGGG 
CGCATCTCCA GCGAGGGCAG CGACCTGGCC GGCATCCTGC GGGTGCTGCT GGAACTGATG 
CAGCGCCATC TGAAGGTCGC GCGCGGCATG GTGACCCTGC GCGATCCGGA ATCGGGGCGG 
ATCTTCGTCC AGCAGGGCTG CGGCCTGAGC GAGGAGGAGG AGGCCTCGGG CAGCCTCGCC 
CACGGCGAGG ACATCGTCGC CCAAGTGGTG GACAGCGGGC GGACGGTGCT GCTGCCGGGC 
GAGGCGGGCA GCCAGTCCTT CCTCTGCGTG CCGATCCGCC GCGACCGCAA GGTGCTGGGC 
GCCATCGTCG CCGAGCGCCA CTACGCCAAC CGCCAGATGC TCGAGCTGGA CGCGGAGATT 
CTCGCCATTC TCGCCGCCAC CACCGCCCAG GCGGTGGAGC TGCACCTGCA GGAGCACGTG 
CGCAAGGTCG CCCTGGAGGA CGAGAACCGC CGCCTGCGCT CGGCCCTGCA GAGTCGCTTC 
AAGCCCAGCA ACATCATCGG CAATTCGCGG CCGCTGCAGG AGGTCTACGG GTTGATCGAG 
AAGGTCACCC GCTCGCGGAC CACGGTACTG ATCCTCGGCG AGAACGGCGT GGGCAAGGAA 
CTGGTGGCCA GCGCCATCCA CTACAACAGC AGCAGCGCCG AGGGTCCCTT CGTCAAGTTC 
AACTGCGCCG CCCTGCCGGA GAGCGTCATC GAGAGCGAGC TGTTCGGCCA CGAGCGCGGC 
GCCTTCACCG GGGCGGCGAC CCAGCGGCGC GGGCGCTTCG AGGCGGCCGA CGGCGGGACC 
ATCTTCCTCG ACGAGGTGGG CGAGCTGTCC CTGGCCATGC AGGCCAAGCT GCTGCGGGTG 
CTGCAGGAGA AGAGCTTCGA ACGGGTCGGC GGCAACGTCA CCCACCAGGT CGACCTGCGC 
ATCCTCGCCG CCACCAACCG CGACTTGCGG GCGATGGTGG AGCAGGGCCG CTTCCGCGAG 
GATCTCTACT ACCGGCTCAA CGTCTTCCCC ATCACCGTGC CGCCGCTGCG CGAGCGCGGC 
TCCGACGTCG CCACCCTGGC GGAGCATTTC GTCGCGCGCT TCTCCGGCGA GATGGGCGTC 
ACAGTGGAGC GCATCTCCGC GCCGGCGATG AGCATGCTGA TGTGCTACCA CTGGCCGGGC 
AACGTGCGCG AGCTGGAGAA CGTCATCGAG CGGGCGGTCA TCCTCTGCGA GGATGCGGTC 
ATCGAACCGC ATCACCTGCC GCCTTCGCTG CAGACCCCGG CGGTTTCCGA GAGCCCGTCC 
GCCGGCGGCA TTCTCGATGT CCGCCTGAGG CAGGCCGAGC ACGAGATGAT CGTCGAGGCG 
CTCAAGCGGC ATAAGGGCAA CATGACCGAG GCCGCCACCC ATCTGGGTCT GACCCGGCGC 
ATCCTCGGCC TGCGCATGGC CCGGCACAAC CTGAACTACA AGGATTTCCG CTGA

Protein sequence

MKPHSANARP GRELPVQDKP CEWDMGECRT DLLPLLGELG RISSEGSDLA GILRVLLELM 
QRHLKVARGM VTLRDPESGR IFVQQGCGLS EEEEASGSLA HGEDIVAQVV DSGRTVLLPG 
EAGSQSFLCV PIRRDRKVLG AIVAERHYAN RQMLELDAEI LAILAATTAQ AVELHLQEHV 
RKVALEDENR RLRSALQSRF KPSNIIGNSR PLQEVYGLIE KVTRSRTTVL ILGENGVGKE 
LVASAIHYNS SSAEGPFVKF NCAALPESVI ESELFGHERG AFTGAATQRR GRFEAADGGT 
IFLDEVGELS LAMQAKLLRV LQEKSFERVG GNVTHQVDLR ILAATNRDLR AMVEQGRFRE 
DLYYRLNVFP ITVPPLRERG SDVATLAEHF VARFSGEMGV TVERISAPAM SMLMCYHWPG 
NVRELENVIE RAVILCEDAV IEPHHLPPSL QTPAVSESPS AGGILDVRLR QAEHEMIVEA 
LKRHKGNMTE AATHLGLTRR ILGLRMARHN LNYKDFR