Gene Avin_33920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_33920
Symbol
ID	7762287
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3469650
End bp	3470816
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	70%
IMG OID	643806253
Product	LacI family transcriptional regulator protein
Protein accession	YP_002800517
Protein GI	226945444
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.104484
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGAAG CTGTTGCACA TGCCTCGACG AATCCTTATG GTAGCGCTGT CATCGCCATT 
CCAATCCATC CCTTTCCTCG TATCGCCGCC GTGACCTCGT CGACCAAGCC CCGCCGCACA 
CGCGCCACCC CGGTACAAGG CAAGCGCGTG ACCCTCAAGG AAGTAGCCGA TGCCGCCGGG 
GTCGGCGAAA TCACCGCCTC GCGCGCGCTG CGCACGCCGG ACATGGTTTC GCCACGCCTG 
CGCAAGCGCG TGCTGGCCGC CGTCGAACGG CTGGGTTATG TCGCCAACCG GGTCGCCAGC 
GGATTGGCTT CCGGTTCCAG CCGGGTGGTG CCGGTGCTGA TCCCGACCCT CGCCCACACG 
GTCTACGTAC CTTTCCTGCG CGGCGTGCAC GATGAGCTCG ACCGGCACGG CCATGAAGTG 
CTGCTGGCCA CTACCGAATA CGACCAGGAC AGCGAGGCGC GGCTGGTCTC GACCCTGCTC 
GGCTGGTTTC CGGCCGGACT GCTGCTGGCC GGTGTGGATC ACCTGCCGGC CACGCGTCTG 
CGCCTGCAAC AGGCGGCCGC GGCGGGAATG CCGGTGGTGG AGTTCATGGA CCTGGCCGAG 
GAGCCGATCG ACATGAACGT CGGCTTCTCG CACCGCGCCG TGGGCGCCGC CGTCGCGGCG 
CATTTCGCCG AGCGCGGCTA CCGCCACATC GCCTACGCCG GCACCCTGGC CGCGCGCGAC 
CGGCGCAGCG CGCGGCGTGC CGAAGGCTTC CGCGTCGAAC TCGCCGCGCG CGGCCTGCCC 
GACCATTACG AACTATGCAG CGAGGAACCG TTCTCGATCG GCCTGGGCGG AAGCCTGCTG 
GCGCAGTTGC TGGAGCGCTA CCCGCAGGTG CAGGCGGTGT TCTTCGCCAA CGACGATCTG 
GCCGCCGGCG CGCTGTTCGA GGCCCAACGG CGAGGCCTGC GGGTGCCGGA GGAGATCGCG 
CTGATGGGCT TCAACGACAC CGAGATCGCC GCCGCGGTGC GGCCGGCGAT CTCCTCCGTG 
GCGGTGGACC GCCATGGCAT GGGCCGGCGC GCCGCCGCGC TGTTACTGGA GCGGCTGGCC 
GGCCGGGAAC CGCCGCAGCG GGTGATCGAC ACCGGATTCG AAATAGTCGC GCGTGCCAGC 
ACCGGCACCT TGCCGCAGAC GCCATGA

Protein sequence

MFEAVAHAST NPYGSAVIAI PIHPFPRIAA VTSSTKPRRT RATPVQGKRV TLKEVADAAG 
VGEITASRAL RTPDMVSPRL RKRVLAAVER LGYVANRVAS GLASGSSRVV PVLIPTLAHT 
VYVPFLRGVH DELDRHGHEV LLATTEYDQD SEARLVSTLL GWFPAGLLLA GVDHLPATRL 
RLQQAAAAGM PVVEFMDLAE EPIDMNVGFS HRAVGAAVAA HFAERGYRHI AYAGTLAARD 
RRSARRAEGF RVELAARGLP DHYELCSEEP FSIGLGGSLL AQLLERYPQV QAVFFANDDL 
AAGALFEAQR RGLRVPEEIA LMGFNDTEIA AAVRPAISSV AVDRHGMGRR AAALLLERLA 
GREPPQRVID TGFEIVARAS TGTLPQTP