Gene Avin_17100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_17100
Symbol
ID	7760645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	1693872
End bp	1695221
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	71%
IMG OID	643804609
Product	hypothetical protein
Protein accession	YP_002798898
Protein GI	226943825
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.550956
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACGA TCCATATCGG TTGTGGGGCG GGCTTTGCCA ACGATCGCCC CGATGCGGGA 
CTGCGCCTGG CGCAGGATCT GGCCCGACGT TCCGGCCGAC GCTATCTCAT GTACGAACTC 
CTGGCCGAAC GCACGCTGGC CGAGGCGCAG TTGCGCAAGC AGGCCGATCC CCGCGCGGGA 
TACGCCGCGC GTCTGTTCGA CTTCCTCCAG CCGGTGCTGG ACACCTGCAT CGAGGCGGGT 
ATCCCGATCG TCACCAATGG CGGCGCGGCC AACCCGCGTG CGGCGGCCGA GCGGCTGCGG 
GCCGAACTGG GCGGGCGCCA TGCCGGCCTG CGTATCGCCT GCGTGCTGGG CGACGATCTG 
ATGGGGATGG ACCGCCGGCG CCTCGGCCAG TGGCTCGACC TCGGCGACCC GCGGGACGAG 
CTGGTTTCGG CGAACGTCTA CAGCGGCGCC GACGGCATCG TCCGGGCCCT GGACGAGGGC 
GCCGCCATCG TGCTCTGCGG ACGGGTCGCC GACCCGTCCC TGGCCGTCGG TCCGATCCGC 
CACGCCCTGG GCTGGGCCGC CGACGACTGG GAGCGGATGG CCATCGCCAC CGTGGCCGGA 
CACCTGCTGG AATGCTGCAC CCAGGCCACC GGCGGCTATT TCGCCCATCC CGGTCTCAAG 
GAGGTGCCCG ATCCGGCCAA TCTCGGCTGT CCGATCGCCG AGGTCGCCGC GGACGGTCGC 
CTGGTGATCA CCAAGACCGC CGGTTCCGGC GGTTGCGTCA GCGAGCGCAC GGTCAAGGAG 
CAACTGCTCT ACGAGGTGCA TGATCCGCGC CGCTATCTCA CCCCCGACGT GGTCCTCGAC 
CTCGGCGCGG CACGGGTGGA GGCCATCGGC GCCGATCGCG TCGCGGTCGG CGGCATCCAC 
GGCCATCCGC GCCCCGATAC GCTCAAGGGG CTGGCCGGCG TGCGCGGGCT CTGGTTCGGC 
GAGGCGGAAA TCTCCTACGC CGGTGCCGGC GCCGTGGCCC GGGCACGGCT CGCCCGGGAG 
ATCCTGCTGC AGCGCTTCGA CCTGCTGGCG CCGGGCGTGC AGCCCTGGAT CGATCTGGCC 
GGCGTCGCCA GCCTGTTCAA CGATGCGCGC GGCGACTATC TCGCCCGGCG CCTGGACCTG 
GCGCCCGAGG TGGACGACGT GCGCGTCCGG GTCGGCCTGG TGCATCGCGA CCGCGCTCTG 
ATCGAGACGC TGCTGGCCGA GGTGGAGTCG CTCTACACCA ACGGTCCGGC CGGTGGCGGC 
GGGGTGCGCC GGCATATCGG CGAATCCATC GCCACCCGCG ACTTCCTGAT TCCCCGCGAG 
GCAATCGAAA CACGTCTGGA GTGGTACTGA

Protein sequence

MTTIHIGCGA GFANDRPDAG LRLAQDLARR SGRRYLMYEL LAERTLAEAQ LRKQADPRAG 
YAARLFDFLQ PVLDTCIEAG IPIVTNGGAA NPRAAAERLR AELGGRHAGL RIACVLGDDL 
MGMDRRRLGQ WLDLGDPRDE LVSANVYSGA DGIVRALDEG AAIVLCGRVA DPSLAVGPIR 
HALGWAADDW ERMAIATVAG HLLECCTQAT GGYFAHPGLK EVPDPANLGC PIAEVAADGR 
LVITKTAGSG GCVSERTVKE QLLYEVHDPR RYLTPDVVLD LGAARVEAIG ADRVAVGGIH 
GHPRPDTLKG LAGVRGLWFG EAEISYAGAG AVARARLARE ILLQRFDLLA PGVQPWIDLA 
GVASLFNDAR GDYLARRLDL APEVDDVRVR VGLVHRDRAL IETLLAEVES LYTNGPAGGG 
GVRRHIGESI ATRDFLIPRE AIETRLEWY