Gene Aazo_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1744
Symbol
ID	9339537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1806343
End bp	1807590
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	37%
IMG OID
Product	transposase IS4 family protein
Protein accession	YP_003721003
Protein GI	298490826
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAA CTACTCCTGC AGCAATGCCA CCATGCTTTG AGAGATGGTG TCAAAGGTTT 
GATAATGTAT TTACTCACAA GGCGCAGAAA AGAGAGTTTA GGAATTATTT AGGGGGATTA 
TTACGTGAAA GTGAGAGAAA AAACCTACTT CAAATGGCAG AGAATGCCCT AGGGGTGACC 
TACCACCGAT TACACCACTT TTTAACTGAA GCACCTTGGT CCATTTCCCA AGTCAATGAC 
CGTCGATTAG AGATTATGAA TAAGTGTAGT CAGACGAGAA TCACCAGAGG ATTTAGCTTA 
ATAATTAATG ATTATGTCCA TAGAAAAAGC GGGAACTTGA GGGATGGAGT AGGAAGACAA 
TATAATATTG GAGAAATTGG GAACACGGAT AATGGGATAG TAGTAGTAAC AACACATCTA 
TATGATGGCA GTAAAAGCTT ACCATTAGAT ATAGAGTTAT ATCACCACGG TTATGATTCT 
TTACCCAAAG GGAAAGAAGA ACCTCTATTT GAGAAGAAAC ATGAGTTAGG AATTAAATTG 
ATAGACCTAA CGTTAAGCCG GGGTTATCAA CCAGGAATAG TAATTATAGA TGCTGCATAT 
GGCAACAATA CATCTTTCTT ATTAAAGATA GAAAATCGGC ATTTAAAGTA TTTAGGAGGA 
TTAGCTGGAA ATCGCAAAGT CCTTACCAGT GACCAAGAGG ATAGTCCACA AATAATTAGG 
TTAGATGAAT TAGCACAAAG TTTACCCCAA ACGGCTTTTA CAGAAATTGA ACTGGAGTTA 
GATAAAACCA AAACATTATG GGTAGTAACT AAAGAAGTAG AAATATTGGG CCTAAGTGGA 
AAGCGGAATA TTGCTATTGT CATTGACGCT TCTACTGTCT CTCAAGCCAC TGATATTAAC 
TACTTTATTA CCAATGTTTC TTCATCAGTT ATCACACCCC AGTGGATAGT CAATACATAT 
TCTCAAAGAA ATTGGGTAGG AGTTTTCTAC AGGGAAGCCA AGGGATGGTT AGGACTCGAA 
GAATATCAAG TTCGAGATAA CAGTAGTTTA CTGCGCCATT TTATTTTGGT TTTCTGTGCC 
TACACTTTTA TTCTTTGGCA TCAGTTAACT GGAGGATTAA GACGAAGGTG GGCTAAGAAA 
CCTTTGAATA CTTTTACTGA GGCTTTAGAA GCGTTTAGAA CAGCCATATC TTTTCTATTT 
ATTGATTGGT TCAACTTGAA TCCGGACGTC TTTCCTTCTT ACTTATAA

Protein sequence

MKETTPAAMP PCFERWCQRF DNVFTHKAQK REFRNYLGGL LRESERKNLL QMAENALGVT 
YHRLHHFLTE APWSISQVND RRLEIMNKCS QTRITRGFSL IINDYVHRKS GNLRDGVGRQ 
YNIGEIGNTD NGIVVVTTHL YDGSKSLPLD IELYHHGYDS LPKGKEEPLF EKKHELGIKL 
IDLTLSRGYQ PGIVIIDAAY GNNTSFLLKI ENRHLKYLGG LAGNRKVLTS DQEDSPQIIR 
LDELAQSLPQ TAFTEIELEL DKTKTLWVVT KEVEILGLSG KRNIAIVIDA STVSQATDIN 
YFITNVSSSV ITPQWIVNTY SQRNWVGVFY REAKGWLGLE EYQVRDNSSL LRHFILVFCA 
YTFILWHQLT GGLRRRWAKK PLNTFTEALE AFRTAISFLF IDWFNLNPDV FPSYL