Gene Avin_20500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_20500
Symbol
ID	7764124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	2041872
End bp	2043071
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	60%
IMG OID	643804947
Product	Phage integrase
Protein accession	YP_002799228
Protein GI	226944155
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCGAA AAACCATCAC TGGCCTCTAC GAGAGAAATG GAATCTGGCA TGTCGACAAG 
GTCGTCAGAG GTCAGCGACT TCAAGAAAGC ACTGGAACAG GCAACCGGGA GGAAGCAGAA 
CAGTACCTGA TACACCGGCT CGAGAAGCTG CGAGAGGAGA AGGTCTACGG TATCCGCCGG 
ATCAGGAGCT GGCGGGAAGC CGCTACCCGC TACCTGGTGG AGTACAAGGA CATGCCGTCG 
ATCGGCTTGG CCGCCACCTA CCTGGAGCAG CTGGATCCCT ACATCGGCGA CCTTCCGATC 
ACACACGTCG ATGACGAGTC GCTTGCTCCA TACATCAGGG ACAAGCTGAA GCCGGGCAGG 
ACATCGACCG GCAAGGTGAA GCCTGGTGTA ACCCCAAGGA CGGTGAACAT CGCCCTGGAG 
AAGGTCATCC GCGTTCTCAA CCTGTGCGCC CGGAAATGGC GCGATGAAGA GAAACGGCCC 
TGGCTGGACA CGGTGCCGAT GATCAGCAAG CTGGACGAGA AGCGATCGAG GCGGACGCCC 
TACCCGCTTT CGTGGGAAGA ACAGTCGCTG CTGTTCTCGG AACTGCCGGA CCACCTGCGC 
CGCATGGCGC TCTACAAGGT CAACTGCGGT TCTCGGGAGC AGGAAGTGGT CAAGCTGAGG 
TGGGACTGGG AGATACCGGT ACCGGAACTC GACACCAGCG TGTTCCTGAT TCCTTCGGAT 
TTTGGAGGCA GGGACAAGGG ATCGGGCGTG AAGAACGGAG AGGAACGGCT GGTCGTGCTG 
AACACTGTGG CCAAGTCGGT CATCGAGGGG CAGCGTGGCC TGGATCCGAC CTGGGTATTC 
CCGTACGGGA TGCCCGACAG GAACGGCAAG GCGACACCGG TTCATCGGAT GAACGATTCC 
GCCTGGAAGA AGGCGCGGGT CAGGGCGGCG AAGAAGTACC AGGAACGCTT CCTGAGACCG 
GCGCCGAAGG GATTCGCCTC GATCCGCGTG CACGACCTGA AGCACACCTT CGGAAGAAGG 
CTCCGGGCAG CCGGTGTAAC CGAGGAAGAC AGGCGGGCCC TGCTAGGCCA CAAGAACGGC 
AGCATCACCA GTCACTACTC AGCGGCGGAG CTGGGAAAAC TGATCGATGA GGCCAACAAG 
ATATCGGCGA CGGACTCACG AGGGCCGGCG CTGACGATAC TGAGGAGAAA GGCAGGATGA

Protein sequence

MARKTITGLY ERNGIWHVDK VVRGQRLQES TGTGNREEAE QYLIHRLEKL REEKVYGIRR 
IRSWREAATR YLVEYKDMPS IGLAATYLEQ LDPYIGDLPI THVDDESLAP YIRDKLKPGR 
TSTGKVKPGV TPRTVNIALE KVIRVLNLCA RKWRDEEKRP WLDTVPMISK LDEKRSRRTP 
YPLSWEEQSL LFSELPDHLR RMALYKVNCG SREQEVVKLR WDWEIPVPEL DTSVFLIPSD 
FGGRDKGSGV KNGEERLVVL NTVAKSVIEG QRGLDPTWVF PYGMPDRNGK ATPVHRMNDS 
AWKKARVRAA KKYQERFLRP APKGFASIRV HDLKHTFGRR LRAAGVTEED RRALLGHKNG 
SITSHYSAAE LGKLIDEANK ISATDSRGPA LTILRRKAG