Gene Avin_16370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_16370
Symbol
ID	7760572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	1618795
End bp	1619811
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	68%
IMG OID	643804537
Product	Transcriptional regulator, AraC family
Protein accession	YP_002798827
Protein GI	226943754
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATCG AGCGCTACTC CATCTCCATG CATTTCCCCC GGGTGCTGAT GAACGCCGCG 
CGCCGTCGCG GGCTCGACGA GGACAGGCTG CTCGCCGAAG CCGGCATCAG CCGCCGGCTG 
CTCGACAACC CGCACCTGCG CATCACCCCC GACCAGTTCA GCCGGCTGAT GCGCGGCGTC 
TGGCGCCTGG GCGACGACGA GTTCCTCGGC ATGGGCGCGC AACGCTGCCG CCAGGGCATC 
TTCGCGCTGA TGGCCAAGCA GGTGGTCCGC TCGCGCACCC TGGGCTCGGT CTATTACAAA 
CTCGGCCACT TCTACAATCT GGTGAACGAC TCGCTGCGCA TGGAACTGCA GGTCGAAGGC 
GACGAGGCCC GCTTCTCGAT GGCCCTGACC GATCCGTCCC AGGACCCGGA CTACCTGCTG 
CGGGAATTCC TGCTGCTGCT CTGGCACCGC TTTCCCAGTT GGCTGATCGG CCAGCGGATT 
CCGCTGAAGT ACGCCACCTT CGACCACGCG GCCCCCGAGC ATCTGGCCGA GTACCGCCTG 
ATGTTCCCCT GCCCGGCGCG CTTCGAGCAG CCGACCAACA GCCTGGTGTT CGAGGCACGC 
ATGCTCGACG CCCCGGTGGT GCAGACCCCC GAGGCCCTGG CCACCCACCT GCGGCGGGCG 
CCGATCGACT GGTTCACCCG GCCCGCCTAC TACCCCGTGT ATACCCGGCG GGTACGCGAT 
CATCTGGAAA GATCCGGCGA CCTGGCCGGC GCGACCATCC AGAGCACCGC CGCCGCCCTG 
CACCTGACCG AACGCACCCT GCGCCGCCGG CTCAGCGCCG AAGGCAGCAG CTTCCAGGGC 
ATCAAGGACG GCATGCGCCG CGACATGGCC ATCCACTACC TGACCCAGCC TTCCATGCCG 
ATCAGCCAGG TCGCCCGGCA GTTGGGCTTT TCCGAGCCGT CCGCGTTCAC CCGGGCGTTC 
AAGCAGTGGA CTGGCGAGCT ACCCAAGACC TACCGGGACG CGGCCCGAAA AATGTAA

Protein sequence

MSIERYSISM HFPRVLMNAA RRRGLDEDRL LAEAGISRRL LDNPHLRITP DQFSRLMRGV 
WRLGDDEFLG MGAQRCRQGI FALMAKQVVR SRTLGSVYYK LGHFYNLVND SLRMELQVEG 
DEARFSMALT DPSQDPDYLL REFLLLLWHR FPSWLIGQRI PLKYATFDHA APEHLAEYRL 
MFPCPARFEQ PTNSLVFEAR MLDAPVVQTP EALATHLRRA PIDWFTRPAY YPVYTRRVRD 
HLERSGDLAG ATIQSTAAAL HLTERTLRRR LSAEGSSFQG IKDGMRRDMA IHYLTQPSMP 
ISQVARQLGF SEPSAFTRAF KQWTGELPKT YRDAARKM