Gene Aazo_3920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3920
Symbol
ID	9341724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	3982670
End bp	3983848
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	34%
IMG OID
Product	DevC protein
Protein accession	YP_003722546
Protein GI	298492369
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGTAA AAATCCCTTT AGCATGGCTA CAGCTTGCCC AGCAAAAAGT ACGTTTTCTT 
GTAGCTGTAG CCGGAATAGC CTTTATTGTA CTGCTGATGT TTATTCAACT TGGGTTCCAA 
GATGCACTTT ATTCTAGTGC TACAGCATTA CATCAAAATC TCAAGGGTGA TTTGTTTTTA 
GTCAGTTCTC AATATAAAGC TTTGACTGCT AATCAAAGTT TTTCTCGAAA TCGTTTATAC 
CAAACATTAG GTTTTAATGG TGTCGAATCA GTTAGCCCTA TATATTTGCA ATTTGCCAAA 
TTAAAAAATC CTGCTACTGG CGAAAAATAT TCAATCTATG TCATAGGTTT TGACCCAGGA 
AAACCAGTGA TGAATCTACC AGAAGTCCAG AATAATTTGG ATATACTTAA AAATACTGAT 
GTCATGTTAT TTGACAAGAA TTCTCGCCCA GAATTCGGTC CAATAGCAGA AAAGTTTGAG 
CAAGGAGATA CTGAACAAAC AATTGAAATC TTTCCCTTTG ATTCTCTTCA AGGTTATCGA 
GTCAGAGTCG GTGGTTTATT CGGTTTAGGA CCGTCCTTTG GTGTCGATGG AAATTTAATT 
GTTAGCGACT CAACTTTCTT AAAGATTAAT CCTAATACCC GTCATGCAGA AAACATAGAT 
GTAGGTATTA TTAAAGTCAA ACCAGGTTTT GACCCAAATG AGGTTCTAAA AGATTTGCAA 
GCAAGTCTAC CTAATGATGT ACAGATATTT ACTCGTAAAG GCTTTATTAA TTTCGAAAAA 
GAATATTGGG CAGCTAGAAC ACCCATAGGT TTCATACTTA ATCTCATGCT AACTATGGCC 
TCTGTGGTGG GTGTAGTTAT TGTTTATCAA ATTCTTTACA GCAATATTGC TACTCAATTT 
ATTGCCTACG CAACATTAAA AGCTATTGGC TACCCTAATG CTTATTTATT AAATGTAGTT 
TTTCAACAGG CATTAATCTT AGCTTTATTA GCTTATATAC CAGGATTTAT TTTCTCCGTT 
ACCTTATATG ATTTTGCGAT GGAAGTAACT AAATTACCAA TCATTATGAC TTCTAATAAT 
GCCTTAATTG TTTTAACTTC TACAGTTCTA ATTTGTATAA CTTCTGGAGC ATTAGCTATT 
AATAAACTTC GCTCTGCAGA TCCGGCTGAT ATTTTCTAA

Protein sequence

MIVKIPLAWL QLAQQKVRFL VAVAGIAFIV LLMFIQLGFQ DALYSSATAL HQNLKGDLFL 
VSSQYKALTA NQSFSRNRLY QTLGFNGVES VSPIYLQFAK LKNPATGEKY SIYVIGFDPG 
KPVMNLPEVQ NNLDILKNTD VMLFDKNSRP EFGPIAEKFE QGDTEQTIEI FPFDSLQGYR 
VRVGGLFGLG PSFGVDGNLI VSDSTFLKIN PNTRHAENID VGIIKVKPGF DPNEVLKDLQ 
ASLPNDVQIF TRKGFINFEK EYWAARTPIG FILNLMLTMA SVVGVVIVYQ ILYSNIATQF 
IAYATLKAIG YPNAYLLNVV FQQALILALL AYIPGFIFSV TLYDFAMEVT KLPIIMTSNN 
ALIVLTSTVL ICITSGALAI NKLRSADPAD IF