Gene Aazo_5244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5244
Symbol
ID	9343109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014249
Strand	+
Start bp	7456
End bp	8556
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	45%
IMG OID
Product	integrase family protein
Protein accession	YP_003723388
Protein GI	298501391
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTATTT CCCAGATGGA TATTACTAAT GTTGAGGTAA GCAACGTAGA AAGTCTCCCT 
CCCTCCGCCA GTAGAGTTGT ATGTCATGAT ACTTCTGCAT CTGTTACCGC TGAATTAGTA 
GAGGAGGTGA TTCGCCAATA TTATTACCTT ACACCTGCTG TAGCAAATGA TGAGGAGTTG 
ATTTTGGCTT GGGCAGGGTC ACAGAACCGT GAGCAAACTA AGCGAAAATA CTATCGCTTT 
GGTCAAAAAT TACTCACTTG GTTGAAAAAT CAAGGTGTAC GAGATTTACG GCTGGTTCAG 
GCACCAAAGT TACTGGAATT TATTGCTAGT TGGGGTGAGG TTTCTCCTTA TACCAAATCT 
AACCAGGTGC TAATATTGCG ATCACTATGG AGCTATGGTC ATGGGGAGAA TGTTGGCTAT 
TTCTTACGGA ATATTACTAG TAGTATAGAT TACGATAATT TCAGTGACTT ACCAAAGGCA 
GAGCGTTATT TAGAAGATTG GGAGATGGCA CAGTTGGCTG ATGTTGCCCA ACGATTGAGG 
GAGCAGTACT GGCTAGTTTT TTCTTTGCTT TTTTATAGTG GGATGCGGGT GGGTGAGGTT 
GGTCGGGTGA CGGTTCCTGG TGATAAACCG GGTCAGCCGA AGGAAGATTA TCCGGGTTTA 
TATTGGCACA ATTTTAAATG GCAGCCCGAC CCGATACCAG AAGATAGTTC CAGGGGATAT 
TACACAATTA AGTTTCGGGG CAAGGGGGGA AAGTACCGGG AAATTGGTTT GGATCACGAA 
ACTTCACGGA TCTTTAAGAA GTACCGGGGG ATGGCAGGTG AAAAGATGCC AGTGTTTCCG 
AATATGTCAC CTAACCCGAA AAAGCGGGGT TTACCGTTGA GTGACCGGGC AATTAAAAGG 
TTGATTCAGG ATATATCTGA GGTGGCGAAG GTAAAGTTTT CTTGCCACTG GTTACGGCAT 
TCTCACGCAT CGCGGGCGGT GGATAGTAAA TCACTGTTTG AGGTGCAAGA CCAGTTAGGG 
CATAGTAAGA GCGATACTAC TAAGACCTAT GTTCGTTCTA AAAAGGATGC GGGAACGGGG 
ACTGTATTAC CGAGGTTTTG A

Protein sequence

MVISQMDITN VEVSNVESLP PSASRVVCHD TSASVTAELV EEVIRQYYYL TPAVANDEEL 
ILAWAGSQNR EQTKRKYYRF GQKLLTWLKN QGVRDLRLVQ APKLLEFIAS WGEVSPYTKS 
NQVLILRSLW SYGHGENVGY FLRNITSSID YDNFSDLPKA ERYLEDWEMA QLADVAQRLR 
EQYWLVFSLL FYSGMRVGEV GRVTVPGDKP GQPKEDYPGL YWHNFKWQPD PIPEDSSRGY 
YTIKFRGKGG KYREIGLDHE TSRIFKKYRG MAGEKMPVFP NMSPNPKKRG LPLSDRAIKR 
LIQDISEVAK VKFSCHWLRH SHASRAVDSK SLFEVQDQLG HSKSDTTKTY VRSKKDAGTG 
TVLPRF