Gene Aazo_1603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1603
Symbol
ID	9339395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1676138
End bp	1677544
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	40%
IMG OID
Product	hypothetical protein
Protein accession	YP_003720904
Protein GI	298490727
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACCA GATTAAAAAT GGCTTTGCTT CTTCACTCTG GAGAATCAGG ATTTGCTATA 
GTAATCGCTG TAGCACTGGG ATTAATTATG ATCTTAGTGG CGTTAACCAT GACGATAAGA 
TCTCAAGGAG ATCAAATATT AGCGTCAACC CGAAAAGAAA CAGAGCGGTC ACTGGCAGCC 
GCAGAAAAAG GTGTTTCCTA TTACCAAGCA TTCCTCAACT CTAACCGGCT ACTGCCCAGA 
TATCCGGATT GTACTCAAGA TCGTACATCT TCTGGTACTT GTCCTGATTC TGGATCTCAA 
AAAAGCTGGT CAAATCCCTC AGCTATTCCC GGAATGAGTG ACAGCCCTTG TACTGGTAGT 
TCAGCATCCA CAGCAACAAT ACAAGGAAAT GCCGACACAA ACCAGTGGAA TCTGGTTGAT 
ACAAATGACT CAAGCAAGGG ACAATATAAA CTGGTTTCTT ATAAAATTGC TGATTCTGGA 
GATGATACTT TGCAGGCAAT GGGCATATTA ACCATTGAGG GAAGAATAAC TAATTCAACA 
GCTAACAGCA AAGCTAATAA ATCTATTAGT AGGGTACAGG TAGCTATTCC TGTTAACTTA 
CCTAGTATTA ATAGTGTTCC AATTCCTGGA GTATGGATTG GTGATTCTAC TACTAATAGT 
GGTACAGGTG GTAATACAAT CCAAGGTAAT GTATTAGTTA ATAGTTGTAA TGTCACCCTT 
TCAGATATCG AAATCGATAG GAGCACTCCA CAGTATTCGG CAATGTATAC AAATTTGAGA 
ATGCCATCAG TCCCAACAAT GCCAGAAGCG GCAAATAATT CTGTCACTCC ACGGGTTGCA 
GGTACTATTT CCTTGGGAAC AATAAATACT GATACCACTC TCCCTCGGCT CACTGGTGAT 
ACACCTGATT TGCCTATAAC ATTTAACGGG CAATCAAGAT ATGTATATTT AGCGACTGAT 
ATAGTCAGAA GTGGGGGTTC AACAGCATTG ACAATTACAC CAGGGAAAAA AGTAGTTATA 
TTTTTATCTG GCAATACAAG TAAAAACGTT GATATTTATC ATGAATGTGG TAGTGTTAGC 
GGTTGTCTAC CTACCGATTT TCAAATTTTT GGCACTAAAC CTAGTGGTGG TGAAATATGT 
CTAAATGGGA ATCATCTGCT AGATGCTTTT ATCTTAGCAC CTACTTATAC AGTCGGGGTT 
GCAGGGGGAG GCAATAGTGG GGGCATAAAT GGTTCTATTT GGGCAAACCA GTGGAGTAAT 
GATTCAGGTT GTGGTTCTAA CTCTAACAAC GTAGTTGTTA GACAATCAGC AAATTGGAGT 
GAATTAACTG GGCTCCAACC AGATAGTAGT GAATTACCAC TTTCAATTAA ATCTATAAGG 
TCTTGGAAAC GAAATGTGGT GAATTAA

Protein sequence

MNTRLKMALL LHSGESGFAI VIAVALGLIM ILVALTMTIR SQGDQILAST RKETERSLAA 
AEKGVSYYQA FLNSNRLLPR YPDCTQDRTS SGTCPDSGSQ KSWSNPSAIP GMSDSPCTGS 
SASTATIQGN ADTNQWNLVD TNDSSKGQYK LVSYKIADSG DDTLQAMGIL TIEGRITNST 
ANSKANKSIS RVQVAIPVNL PSINSVPIPG VWIGDSTTNS GTGGNTIQGN VLVNSCNVTL 
SDIEIDRSTP QYSAMYTNLR MPSVPTMPEA ANNSVTPRVA GTISLGTINT DTTLPRLTGD 
TPDLPITFNG QSRYVYLATD IVRSGGSTAL TITPGKKVVI FLSGNTSKNV DIYHECGSVS 
GCLPTDFQIF GTKPSGGEIC LNGNHLLDAF ILAPTYTVGV AGGGNSGGIN GSIWANQWSN 
DSGCGSNSNN VVVRQSANWS ELTGLQPDSS ELPLSIKSIR SWKRNVVN