Gene Avin_32100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_32100
Symbol
ID	7762110
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3306480
End bp	3307646
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	59%
IMG OID	643806083
Product	Transposase, IS4 protein
Protein accession	YP_002800347
Protein GI	226945274
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGTGCTGG GCATGGCCTT GTTCCGCGAT GAGCCTGTGC ATGAGGTGGC CAGATGCCTG 
AATATCTGTG CTCAAGGCCT GGCCTCCGAT CAACTGCTGG CGCGCAGCGG CGTGACTGAA 
GCGCATAAGC GACTAGGAGC CGATCCAGTC GAATCCTTGT TCCGCCAGAC AGGTAAACAA 
TGGGGTGGCG AGCGATACGA AGGCGATGAT TGGAACGGTT TGCAAGTGTT TGCGGTGGAT 
GGCGCATTGC TGCGAACCCC TGATTCACCT GAGCTGCGAG AGCATTTTGG CTCTGGTAAC 
ACGGGGACCG AGCGCCAGAC GCCTTTTCCA ATGCTGCGTC TCGTTGCCCT GATGAATGTG 
CGTTCTCACG TGATCCTCGA TGCCCAGCTC AGCCCCTATC GCGGCAGCGA GATGCGCTTG 
GCCGAAACCT TCCTCGGCCA GATCCCGGAC AATTCGATCA CGTTGTTCGA CAAAGGCTTT 
TGGGGCGCTG ATCTGCTGTC AAGCGTCGCC GAAGGTGGGA GCAGTCGTCA CGGGTTGACG 
CCGGCTCGCA AGAATCTGGT CATAGAGGAA ATCGAGCGTT GTGGCGAGCA CGATCGCCGT 
GTTCGGATGA AGGTCTCGCC CCAGGCACGC AAACGAAACC CGAATCTGCC CACGCATTGG 
GATGTGCGTG AGGTCAGTTA TGAAAGCCAA GGGCACGCCA GATCGCTGCT CACTTCAGTC 
CCCGTAGAAA GCTACAGCGC AGGCGCTGTC GCCGCGTTGT ACCTGGAGCG CTGGGAGATT 
GAGTTGGGCT TCCGGGACAT CAAAAGCTCG ATGCAACAGA ACGCAGTGAC GCTGCGTAGC 
AAGAAGGTCG AGCTGATTTA TCAGGAAGTC TGGGGGCTCT TGCTGGCTTA CAACATCATT 
CGCCGCGAGG CCAGCCAAGC CGCTGTGGCC TTTGGGCGAG CGCCCTCGGA CATACGCTTC 
AAACCCGCCT GTCAGTACAT CGCCGTGCTA TTGATCGTCA TGGCGGCGGC CAATCCGGTA 
TCGGCAACGG GTAGGAGGTT GGCTGAGCTG CGAGGAGGTA TCGGGGGACT GTTTCTGGAT 
CACCGTCCAA GGCCAGGAAG GCCAAGGACG GTGAAGATTT CCAAAACCCG ATATCCAGTG 
GATCGTAAGG CCGCTCCGCT TAAGTGA

Protein sequence

MVLGMALFRD EPVHEVARCL NICAQGLASD QLLARSGVTE AHKRLGADPV ESLFRQTGKQ 
WGGERYEGDD WNGLQVFAVD GALLRTPDSP ELREHFGSGN TGTERQTPFP MLRLVALMNV 
RSHVILDAQL SPYRGSEMRL AETFLGQIPD NSITLFDKGF WGADLLSSVA EGGSSRHGLT 
PARKNLVIEE IERCGEHDRR VRMKVSPQAR KRNPNLPTHW DVREVSYESQ GHARSLLTSV 
PVESYSAGAV AALYLERWEI ELGFRDIKSS MQQNAVTLRS KKVELIYQEV WGLLLAYNII 
RREASQAAVA FGRAPSDIRF KPACQYIAVL LIVMAAANPV SATGRRLAEL RGGIGGLFLD 
HRPRPGRPRT VKISKTRYPV DRKAAPLK