Gene Aazo_4032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4032
Symbol
ID	9341836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4090441
End bp	4091556
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	39%
IMG OID
Product	binding-protein-dependent transporter inner membrane protein
Protein accession	YP_003722621
Protein GI	298492444
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTGGT GGCAGAGACT CAAGAAAAAT TCTTTAGCGC AATTTGGGGC AACTCTACTA 
TTAGTGTTCT ATGTAGGAGT AATTGGGGCT GATTTTATCG CCCCCTATAA TCCTTACGAT 
TCACAGCCAA ATGGTTCACT ATTGCCACCA ACCCGTATTC ATTGGGTTTC CCCAGAAGGT 
GAATCTATTG GGCCCCATAT TTATCCCACA ACTCAAGGAG ACATAAGTCT AGAAACAGGG 
GAACGGAAAT TAATTATAGA CCTTAAAAAA CCAACACCGT TAGGTTTCTT TGTTTCCGGG 
ACTGAATATA AATTATTTCA ATTAAGTTTA CCCCTACCTC CTAAATGGGA TGAAGTCACC 
ATTATTCCTG GTATACCCCT AAATTGGCAT TTATTTGGTT CAACTGGCGA AGCAAAATGG 
AATATTTTGG GTACTGATGA ACAAGGAAGA GATCAGTTTA GTCGTCTGCT TTATGGTGGT 
CGGATTAGTT TATTTATTGG TATTTTTGGC ATCATCATCA CCTATCCATT GGGCTTGCTG 
ATAGGTGGTA TATCTGGTTA TTTCGGCGGT GTAATTGATA GTGTAATCAT GCGTTTAGCA 
GAAGTGTTGA TGACCTTTCC CAGCATTTAT CTGTTAGCAG CATTATCAGG AGTGTTAAGT 
CCACAATTAA CCAGTACACA AAGATTTTTA TTAATTGTTG TTATTACATC TGTAATTAGT 
TGGGCAGGTT TAGCCAGAGT GATTCGTGGT CAAGTCCTAT CAATTAAAGA ACGGGAATTT 
GTACAAGCAT CACTAGCCAT GGGTGGTAAG CCGATTTATA TTATTCGCCG TCATGTTCTG 
CCCCAAACGG CTAGTTATGC AATTATTTCT GCTACTCTAA CAATTCCTAG TTTTATTGGT 
GCAGAAGCAG TTTTGAGTCT GATTGGTTTA GGCATTCAAC AACCAGATCC CTCTTGGGGA 
AATATGCTTT CCTTAGCAAG TAATGCTTCA ATTTTAGTAT TACAACCTTG GCTGATTTTG 
CCACCTGCAA TATTAATTAT TCTCACTGTT TTAGCTTTCA ACTTACTGGG TGATGGGTTG 
CGTGATGCCC TAGATCCCCA AAGTTTGCAG AGGTAA

Protein sequence

MNWWQRLKKN SLAQFGATLL LVFYVGVIGA DFIAPYNPYD SQPNGSLLPP TRIHWVSPEG 
ESIGPHIYPT TQGDISLETG ERKLIIDLKK PTPLGFFVSG TEYKLFQLSL PLPPKWDEVT 
IIPGIPLNWH LFGSTGEAKW NILGTDEQGR DQFSRLLYGG RISLFIGIFG IIITYPLGLL 
IGGISGYFGG VIDSVIMRLA EVLMTFPSIY LLAALSGVLS PQLTSTQRFL LIVVITSVIS 
WAGLARVIRG QVLSIKEREF VQASLAMGGK PIYIIRRHVL PQTASYAIIS ATLTIPSFIG 
AEAVLSLIGL GIQQPDPSWG NMLSLASNAS ILVLQPWLIL PPAILIILTV LAFNLLGDGL 
RDALDPQSLQ R