Gene Avin_16800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_16800
Symbol
ID	7760614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	1667263
End bp	1668474
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	63%
IMG OID	643804578
Product	transposase, IS605
Protein accession	YP_002798868
Protein GI	226943795
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTCGAC TTCAAGCCTT CAAATTCGAA GTGATGCCAA CCGGCGAACA GCAGCGCCAG 
ATGCGCCGCT TCGCTGGCTC GTGCCGGTTC GTGTTCAACA AGGCATTGGC GTGGCAAAAG 
GAACGCTACG AACAGGGCGA ATCGAGGCTC GGCTATGCCG GACTGTGCAA GCGGCTCACG 
GAATGGCGGC ATGATCCGGA GACGGCCTGG CTGGCGGATG CACCGGTTCA TCCGCTGCAA 
CAGGCACTCA AGGACCTGGA GCGAGCCTAC GCCAATTTCT TCGCCCAGCG GGCCGACTTC 
CCGCGCTTCA AGAAGAAGGG CCGGCGCGAC AGCTTCCGCT ATCCCGACCC GAAGCAGATC 
AAGCTCAACC AGGAAAATAG CCGCCTGTTC CTGCCCAAGC TCGGCTGGCT GCGTTATCGC 
AACAGCCGGA ACGTGTCCGG CATGGTGAAG AACGTCACCG TCAGCCAGTG TTGCGGCAAG 
TGGTTCGTGT CCATCCAGAC CGAGCGCAAG ATGGCGCAAC CCATCCCGAA GGGTGGTGCG 
GTCGGCATCG ACATGGGGGT GTCCCGCTTC GCCACGCTCT CGGACGGCAC GTTCTACGCT 
CCGCTCAACA GCTTCAAGCG GCACGAGGAC AGGCTGCGCA AGGCGCAGCG GGCGATGAGC 
CGCAAAACCC GACTCAGCAA CAACTGGAAG AAGGCGAAAG CCCGCATCCA GCGTATCCAT 
TCCCGGATCG GCAACGCCCG CCGTGACTAC CTGCACAAGA TCTCGACCAC GATCAGCCAA 
AACCACGCGA TGGTGTGTAT CGAGGACTTG CCGGTGCGGA ACCTGTCCAG GTCGGCGGCA 
GGCACAACCG AAGTACCGGG CAGAAACGTT CGGGCCAAGT CCGGCCTGAA CAAAGCCATC 
CTCGACCAGG GCTGGTTCGA GTTCCGCCGC CAACTGGACT ACAAGCTGGC GTGGAACGGC 
GGCTGGCTCG TTGCCGTGCC GCCACGGAAC ACCAGCCGCA CCTGCCCGTG CTGCGGGCAT 
GTGTCGGCGG ACAACCGGCA GAGCCAGGCC CGGTTCGAGT GCGTGGAGTG TGGTTTCGAG 
GAAAACGCCG ATGTGGTCGG CGCGATCAAT GTGTCAAGGG CGGGACACGC CCGGTTCGCC 
TGTGAAGTGA GCGGTGTGGT AAGGCCGCCA GCAGCAGGAA CCCGCCGAGG TGAGTCGGCC 
CGGGTGGGCT GA

Protein sequence

MLRLQAFKFE VMPTGEQQRQ MRRFAGSCRF VFNKALAWQK ERYEQGESRL GYAGLCKRLT 
EWRHDPETAW LADAPVHPLQ QALKDLERAY ANFFAQRADF PRFKKKGRRD SFRYPDPKQI 
KLNQENSRLF LPKLGWLRYR NSRNVSGMVK NVTVSQCCGK WFVSIQTERK MAQPIPKGGA 
VGIDMGVSRF ATLSDGTFYA PLNSFKRHED RLRKAQRAMS RKTRLSNNWK KAKARIQRIH 
SRIGNARRDY LHKISTTISQ NHAMVCIEDL PVRNLSRSAA GTTEVPGRNV RAKSGLNKAI 
LDQGWFEFRR QLDYKLAWNG GWLVAVPPRN TSRTCPCCGH VSADNRQSQA RFECVECGFE 
ENADVVGAIN VSRAGHARFA CEVSGVVRPP AAGTRRGESA RVG