Gene Aazo_5049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5049
Symbol
ID	9342858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	5166320
End bp	5167681
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	41%
IMG OID
Product	FAD-dependent pyridine nucleotide-disulfide oxidoreductase
Protein accession	YP_003723277
Protein GI	298493100
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTGTTT CACCTCAAAA AAAGCCATCA CATGAGGTTG TCATCATTGG TGGTGGTTTT 
GGTGGACTGT ATGCAGCAAA GGCTCTTGCT AACACAAATG TAAATGTTAC TCTCATTGAT 
AAACGTAACT TTCACCTATT TCAGCCGCTT TTATATCAAG TTGCCACAGG TACGCTATCA 
CCTGCTGATA TTTCTGCACC ATTGCGTTCT GTATTTAGCA AAAGCAAGAA TACAAAAGTG 
CTGCTGGGAG AAGTAAATAA TATTGATCCA AAAGCGCAAA AAGTTATTAT GGGTGATGAA 
ATAATACCCT ATGATACATT AATTGTGGCT ACAGGTGCTA ACCATTCCTA TTTTGGTAAG 
GATAACTGGA GAGAATTTGC TCCTGGCTTG AAAACTGTGG AAGATGCGAT AGAAATGCGT 
CGCCGGATAT TTTCAGCATT TGAAGGGGCA GAAAAAGAAA CGGATCCCGT AAAAAGTCGT 
GCTTTTTTGA CTTTTGTGCT TGTGGGGGGT GGTCCGACTG GTGTAGAATT AGCAGGTGCG 
ATCGCAGAGT TGGCATACAA AACTCTACAA GAAGATTTCC GCAACATTAA CACTTCAGAA 
ACGAGAGTTT TACTATTGCA AGGGGGCGAT CGCATTCTCC CACACATTGC ACCAGAGTTA 
TCCCAAGCAG CCGCAGCAGC CTTGCAAAAG TTGGGAGTGG TTATCCACAC TAATACCAGG 
GTGACAAATA TTGAAAATGA CATTGTTACT TTCAAGCAAG ATGGTGAATT GATAGAAATT 
GCTTCAAAAA CTATCTTGTG GGCAGCAGGT GTTCAGGGTT CGGCACTGGG GAGAATTTTA 
GCAGAACGTA CAGATGTAGA ATGTGATCAC GCTGGGCGTG TAATTGTAGA ACCGAATTTG 
ACTATCAAGG GTTATAAAAA CATTTTCGTA ATTGGAGATT TAGCCAACTT CTCCCATCAA 
AATGGGAAAC CCTTACCTGG TGTTGCACCC GTAGCCAAAC AACAAGGAGA GTATGTAGGT 
GGACTGATTC AACTACGGCT TCAAGGTCAT ACTTTGCCAG AATTTCATTA CACCGACGTG 
GGTAGTTTGG CAATGATTGG GCAAAATTTA GCTGTTGTAG ATTTAGGCTT CATCAAACTC 
ACTGGTTTCC TTGCTTGGGT ATTTTGGCTA GTAATTCACA TCTACTTCTT AATCGAGTTT 
GATACTAAAT TAGTAGTAGT AATTCAGTGG GCGTGGAATT ATATCACTCG TAATCGTCGC 
TCTCGATTGA TTACAGGTAA AGAAGCTTTT TTAGATCCAC AACCTGTTAA CAGTAGCAAT 
AATTCCCAGA CTACAGAAAA GAAGCAAGCA GTCAAGCTCT AG

Protein sequence

MVVSPQKKPS HEVVIIGGGF GGLYAAKALA NTNVNVTLID KRNFHLFQPL LYQVATGTLS 
PADISAPLRS VFSKSKNTKV LLGEVNNIDP KAQKVIMGDE IIPYDTLIVA TGANHSYFGK 
DNWREFAPGL KTVEDAIEMR RRIFSAFEGA EKETDPVKSR AFLTFVLVGG GPTGVELAGA 
IAELAYKTLQ EDFRNINTSE TRVLLLQGGD RILPHIAPEL SQAAAAALQK LGVVIHTNTR 
VTNIENDIVT FKQDGELIEI ASKTILWAAG VQGSALGRIL AERTDVECDH AGRVIVEPNL 
TIKGYKNIFV IGDLANFSHQ NGKPLPGVAP VAKQQGEYVG GLIQLRLQGH TLPEFHYTDV 
GSLAMIGQNL AVVDLGFIKL TGFLAWVFWL VIHIYFLIEF DTKLVVVIQW AWNYITRNRR 
SRLITGKEAF LDPQPVNSSN NSQTTEKKQA VKL