Gene Aazo_4456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4456
Symbol
ID	9342258
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4541507
End bp	4542880
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	45%
IMG OID
Product	hypothetical protein
Protein accession	YP_003722884
Protein GI	298492707
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAATCG GTTTTCTCAG ACAAGCTATC AACGCCCTAC AACTCCAGTC TCATGGACGC 
ACTTCCCATC GGGTCAACCA GTGGTTTAAG TGGTTATCAC CTGGATTATC AGTAAAACGC 
TGGTTTTTCG TCAGTGTTGG GGGTTTTTTA CTGGCAAGTT TGGGGTTGGC TATTTGGATT 
AAGCTAACCC CGATTTTCTG GATATTAGAG TTTCTCAGAG GTTTGCTGGG TTTCCTCACG 
GACATACTAC CCAACTATAT CAGCGGACCT TTGGTTTTAC TGTGCGGTAT CTTACTGCTG 
CTGTGGGGAC AATCCCGCAC CGTAGGTTCA ATTACTGAAG TGCTAAGACC ACAGGGGGAT 
GAGGAAGAAC TGATAGATGT TTTGCTGGCA CATCGCCGTT TATACCGGGG TCCGAAAATT 
GTCGTCATTG GTGGCGGTAC TGGACTGTCT ACTTTACTCA GGGGCTTAAA AACCTACAGT 
GCTAATATTA CTGCTATTGT TACCGTGGCT GATGATGGTG GTTCTTCTGG CAGGTTGCGT 
CAGGAATTTG GCGTTTTACC TCCTGGGGAT ATTCGCAATT GTTTGGCTGC ACTAGCTGAT 
GAAGAAAAGT TATTAACAGA ATTGTTTCAA TATCGTTTTC GCGCAGGAGA TGGGTTGACA 
GGTCACAGTT TTGGTAACTT GTTTTTAACT GCCATGACTG ATATTACTGG AGATTTAGAA 
AGGGCAGTTG CAGCTAGTTC CAAAGTTCTT GCCGTGAGGG GACAAGTTTT ACCCGCAACC 
CTCAGTGATG TTCGTCTTTG GGCAAAATTA GAAGATGGGC GCCGGATTGA AGGTGAGTCC 
AGCATTCCCA AAGCTGGGGG AAAAATTGTT CAAATTGGCT GTATTCCTGA AAATCCTCCC 
GCCTTACCCG CAGCGATTAA AGCAATTAAA GAAGCTGATT ACATTATTAT TGGACCGGGC 
AGTTTGTATA CTAGTCTAAT ACCTAATTTA TTAGTACCAG AAATTGCCGA TGCGATCGCA 
GCCCAAAATA TTCCCCGTAT CTATATCTGC AATATCATGA CCCAACCGGG AGAAACAGAA 
GGATACACCG TAGGCGAACA CATCCAAGCC ATTGATAAAG CTTGTGGCGA CAGAAGGCTG 
TTTGATGCCG TACTAGTACA TAAAAAAACC CCATCAGCCC AAGCCCTCAT TCGCTACGCC 
CAGCAAAATT CCCATCCCGT TTTCCTAGAC CGAGAAACCG TCATCAAACT AGGAAGAAGA 
ATAGTCCCCT CCAACATCTT GTATGAAGAC GAAACCGGAT TTGTTCGCCA CGACCCACAA 
AAACTAGCCA AGGTTTTATT GAAATGGTAT AATGGAGCGC AGCATGGGAA GTAA

Protein sequence

MSIGFLRQAI NALQLQSHGR TSHRVNQWFK WLSPGLSVKR WFFVSVGGFL LASLGLAIWI 
KLTPIFWILE FLRGLLGFLT DILPNYISGP LVLLCGILLL LWGQSRTVGS ITEVLRPQGD 
EEELIDVLLA HRRLYRGPKI VVIGGGTGLS TLLRGLKTYS ANITAIVTVA DDGGSSGRLR 
QEFGVLPPGD IRNCLAALAD EEKLLTELFQ YRFRAGDGLT GHSFGNLFLT AMTDITGDLE 
RAVAASSKVL AVRGQVLPAT LSDVRLWAKL EDGRRIEGES SIPKAGGKIV QIGCIPENPP 
ALPAAIKAIK EADYIIIGPG SLYTSLIPNL LVPEIADAIA AQNIPRIYIC NIMTQPGETE 
GYTVGEHIQA IDKACGDRRL FDAVLVHKKT PSAQALIRYA QQNSHPVFLD RETVIKLGRR 
IVPSNILYED ETGFVRHDPQ KLAKVLLKWY NGAQHGK