Gene Avin_32920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_32920
Symbol
ID	7762190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3370991
End bp	3372232
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	71%
IMG OID	643806160
Product	hypothetical protein
Protein accession	YP_002800424
Protein GI	226945351
COG category	[R] General function prediction only
COG ID	[COG3975] Predicted protease with the C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCCT GTCCGCGTCT GCCGCTCTGC GCCGTCCTGC TGATCGCGTC CGTTCCGTCC 
TGGGCGGCGA ACAAGGTCGA TCTGGACTAC CACGTGCGTT TCCTGCCGGA GCGCGACCAG 
GCCGAGGTGC GCCTGACCCT GGAGCAGGGC AGCGCGGTCC GCAGCCTGCG CTTCGATCTG 
GGCGACCAAG GCCGCTACAG CGATTTCCAG GCCGACGGGC AGTGGCAGCA GGAGGAGCCC 
GGCAGCGGCG TCTGGCGGCC GGCGGAGGGC AAGAGCAGCC TGAGCTACCG GGTACGGGTC 
AACCATGCGC GCGCCTCCTC CGGGCGTTTC GATGCGCGGA TGACCGGGAA CTGGGCGCTG 
CTGCGCGGCG ACGATCTGGT GCCCAGCGCC CATCTGGACC AGCAGGACGG CGTGGAACTG 
GTGGCGCGCC TGGAGTTCGA GCTGCCCGAG GGCTGGACGG GCGTCGAGAC CGGCTGGCCG 
CGCATCGGCA GGAACCGTTT CCGCATCGAC AACCCGGCGC GCCGCTTCGA CCGGCCGACC 
GGCTGGCTGC TCGCCGGCCA GCTCGGCACC CGGCGGGCGA TCCTGGGCGG CAGCGAGGTC 
AGTGTGGCGG CGCCGCTCGG CGAGGGCGTG CGGCGGATGG ACATCCTGAC CCTGCTGACC 
TTCGTCTGGG ACGAATACCG GACGGTGTTC CTGCGCGCGC CCGGCAAGCT GCTGGTGGTC 
GGCGCCGGCA ACCCGATGTG GCGTGGCGGC CTGTCGGCCC CCAACTCCCT GTACCTGCAC 
GCCGATCGTC CGCTGGTCAG CGAGAACGGT ACCAGTCCCT TGCTGCACGA ACTGGTGCAC 
GTGTTCGCCC GGATTCGCGA CACCGATGCG AGCGACTGGA TCAGCGAGGG GCTGGCCGAG 
TACTACGCCA TCGAACTGCT GCGCCGCGCC GGCGGTCTCG CCGAGGATCG CTACGAGCGG 
ATCTATCGGC AACTGGAGCA CTGGAGCCGC GAGGTCGGCA GCCTGCGCGG CGAACGGATC 
AGCGGTCCGG TCACCGCCCG CGCCGTGCTC CTGCTGCGGG CGCTCGACGC GGAGATCCGC 
GCGCGCAGTG AGAACCGCCA TTCGCTGGAC GATGTGGTGC ACGGGCTGAT TCGCATGGAG 
CGGGTCAATA CCGACGACTT CGTCGCGCTC AGCGAGAACC TCATGGGCGG CGAGTCGCGG 
GTGCTGGATA CGCCTCTGCT GGCGCCCGGG GCCGGGCGGT GA

Protein sequence

MSACPRLPLC AVLLIASVPS WAANKVDLDY HVRFLPERDQ AEVRLTLEQG SAVRSLRFDL 
GDQGRYSDFQ ADGQWQQEEP GSGVWRPAEG KSSLSYRVRV NHARASSGRF DARMTGNWAL 
LRGDDLVPSA HLDQQDGVEL VARLEFELPE GWTGVETGWP RIGRNRFRID NPARRFDRPT 
GWLLAGQLGT RRAILGGSEV SVAAPLGEGV RRMDILTLLT FVWDEYRTVF LRAPGKLLVV 
GAGNPMWRGG LSAPNSLYLH ADRPLVSENG TSPLLHELVH VFARIRDTDA SDWISEGLAE 
YYAIELLRRA GGLAEDRYER IYRQLEHWSR EVGSLRGERI SGPVTARAVL LLRALDAEIR 
ARSENRHSLD DVVHGLIRME RVNTDDFVAL SENLMGGESR VLDTPLLAPG AGR