Gene Avin_52100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_52100
Symbol
ID	7764047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	5322077
End bp	5323537
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	70%
IMG OID	643808026
Product	hypothetical protein
Protein accession	YP_002802260
Protein GI	226947187
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGGTG CATTGCTTCG TACCGGAACG CTGCGGGAAT TCAGGGCGCT CGGCGTCGAT 
GGCCAGCCGG TGCACGGCGT GGCGCTGCAG TTGCGCGAGG CCATCCGCCT GAAGATGCAG 
CGCGAGGCGG CCGATTGCCT GGCCATCCCG CAATCCAACG AGGCGGGGGA CCGCATCGAC 
TGGTACGCGC CGTTCGAGGG CGACGTAGTG CCCTGGTCGG CGGCCACCGC GGAAGAGCGC 
ATCCAGGCCC GTGCCCGGCT CGAGGCGATG CAGGCCCGGT TGCGGGCCAC CGGCGAGAAC 
ATGCGCGACG ACGTGCAGAA CCGGGAGAAG CAGGTCTTCG GCCGTCTCTT GGAAAAGGCC 
CTGTATTTTC CCGATGCCGA CCATGTCTAT CTGGTCGACG GCCGGCCGGT GGTCACCTTC 
TGGGGCTTCA CCCGGCAGCA GGACGGCCAG TCGCCCGATC CTCTCGCCTG CCTGCAGGTC 
GCCAGGCCCG CCCCGGCCCC CGTGGCGGAC ACCGTCTTGC CGCCGCCCGT GACGCCTGCG 
GCGGCAGCCG CGGCCGCGGT TGCGGAAAAA CCCCGCTGGC GGCGCTGGCT GTGGCTGCTG 
CTCCTGCCGC TGCTCCTGCT GTTGCTGCTG TTCCTCATGC GCGCCTGCGC GCCGACCGTC 
GAACTGCCCT TCGATCTGTC GCATGTCGAC CTGCCCGGCC TGCCGGCCAG GGAAAGGGTC 
GCGGAAGAGG TCCGGCTGCG CGAGGAGGTG GTGGGCGTGA CGGGCGCGGC CGGTGTCGTC 
GGAACCGAGG GAGAAGGTAG CGTGCCGGTA CCGGACGGCG AAATGACTGT CGAGGAAGTG 
CCGCTCGAAG AGGGATCGGC GAGCGAATCC GAAGCGGGCG AAGCCGCGGC GGTTGACCCC 
GCGGCCGAAG AGGCGACGCA GGACCGGCAA CCGTCCGCCG GGGACGGAGA GAAGGAGCCG 
GAGGCGACGC CCGAAGACGC ACAACAGAAG CCGCCGGTTC CGCCGCAACT CAACGAGGAA 
AAGCCGGCGC AAGACCCGAA GGCCGCGCAG GAGCAGGAAA AAGGAGCCGG GGAACAGCAA 
GGCGCCAAGC CCATGAGCAT TCCGCCCGAG GCGCTGAAGA GCGGTTCGAC CCGTTTCCTC 
GACGGCAACT GGCGGGCCGG CGCCGGCATC CAGGACGCCA AGACCGGCAA GCCGCTGCAG 
CTGGGTTACG ACTTCAAGGA CGGCAAGGGC CAGGTCAGCA TCCGCCGTGA CGACGGTGTG 
CGCTGCGCGG GCCCGGTGAA CGCGACCGTG CAGGGCGGCA GCCTGGCGAT CGCCAGCCAG 
GGCCAGGCGA CCTGCAGCGA CGGCAGCCAC TACCGCATGC CGGAAGTGAC CTGCAAGCCG 
GATGCGCGCA GCGCGGCCGA CTGTACCGGC CGCTACGGCG ACCAGGAATT CCCCATGTCG 
ATCCGCCAGG GCGGCAACTG A

Protein sequence

MPGALLRTGT LREFRALGVD GQPVHGVALQ LREAIRLKMQ REAADCLAIP QSNEAGDRID 
WYAPFEGDVV PWSAATAEER IQARARLEAM QARLRATGEN MRDDVQNREK QVFGRLLEKA 
LYFPDADHVY LVDGRPVVTF WGFTRQQDGQ SPDPLACLQV ARPAPAPVAD TVLPPPVTPA 
AAAAAAVAEK PRWRRWLWLL LLPLLLLLLL FLMRACAPTV ELPFDLSHVD LPGLPARERV 
AEEVRLREEV VGVTGAAGVV GTEGEGSVPV PDGEMTVEEV PLEEGSASES EAGEAAAVDP 
AAEEATQDRQ PSAGDGEKEP EATPEDAQQK PPVPPQLNEE KPAQDPKAAQ EQEKGAGEQQ 
GAKPMSIPPE ALKSGSTRFL DGNWRAGAGI QDAKTGKPLQ LGYDFKDGKG QVSIRRDDGV 
RCAGPVNATV QGGSLAIASQ GQATCSDGSH YRMPEVTCKP DARSAADCTG RYGDQEFPMS 
IRQGGN