Gene Aazo_2540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_2540
Symbol
ID	9340339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	2643450
End bp	2645093
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	43%
IMG OID
Product	major facilitator superfamily protein
Protein accession	YP_003721559
Protein GI	298491382
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.824873
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATCGT CTGATTTGGA TAGAAAAGTC CCGCCTCTAT CACCTAGCCA AGCTCAAAAC 
AAGATTAGGG TATCAGAATC TACAAGACTT AATCATTTAA ATTCTGTTCC CCAGTCTCAG 
CCTGGCCAAA TTAATAAGCA AGAAATGTCT GTCAAAGAAG TTGCTAATGA TCAAAAAGGG 
ACAACAGAAG TTAATTTAAC TGATATCCCT AAACCATCGG CACTGCATTC TGACATCGCC 
CTGACAATTA CTGAACAAAA TGGCAAAGTT AATAGAACAC AACAGACTTT GCCAGAAGCG 
ATTTCAACAG AAACATCACA ATTAAATGGC TCTGGTTCGG GTGGAGAAAC GGCATCACGA 
GATGTAGAAA AACAAGGATT TTTTCCTGTC CTGAAAAACC CGAATTTTCT AGCTCTTTGG 
GGTGGTCAAA TTTTCTGTCA ACTGGCGGAT AAAGTATATC TGGTGCTGAT GATTGCTCTG 
ATTAATAGCG AGTTTCAACA GGGTGGTCAA AGCATTAGTG GTTGGGTATC GGCGTTAATG 
ATGATTTTTA CCATTCCCGC AGTGCTGTTT GGTTCAGTCG CTGGTGTGTT TGTAGATCGC 
TGGTCAAAAA AAGTTGTGCT GGTGGCATCG AATATTTGGC GCGGTATTCT AGTTTTAGCC 
ATTCCTTTTT TACTTTGGTT AACCTATGAT TGGCAACCTG TAGGAGTTTT GCCGGTGGGT 
TTTCTGATGA TTTTGGCAGT AACTTTTTTG GTTTCTACGT TGACACAGTT TTTTGCACCA 
GCAGAACAGG CTGCTATTCC TTTGGTGGTG GAAGAACAGC ATTTACTTTC TGCTAATTCC 
CTGTACACAA CTACGATGAT GGCATCGGTA ATTGTCGGTT TTGCTCTGGG GGAACCAGTT 
TTGGTATTAG CAGATGGAAT TTGGTCACAA TTCGGTGGTA GTGGAGGACT GGGTAAAGAA 
ATTTTGGTTG GTGGTAGTTA TGCGATCGCC GGAATTATTT TATTACTGCT CAGAACTAAC 
GAAAAACCCA ACCCCCCAGA AACAGAATTC CCTCATGTTT TCTCTGATCT GCGCGATGGT 
TTGCGTTATC TCCAAGAAAA TCAGCGTGTC CGCAATGCTT TATTACAACT AATTATTTTA 
TTTTCTGTCT TTGCAGCCTT AACCGTACTC GCGGTTCGCA TGGCAGAAAT TATCCCCAAT 
CTCAAAGCTT CCCAATTCGG CTTTTTACTC GCATCTGGTG GTGTTGGTAT CGCCGGTGGT 
GCAACCATTC TCGGTCAATT TGGACAACGC TTTTCCTATA GGCAACTTAG TCTGTGGGGT 
TGTCTCGGCA TGGCAGCATC TTTATTCGGT CTTTCCATCT TCACAACCCA GCTAGGTGCA 
GTGCTGCTAT TACTAGCTTT AGTTGGTGTA TTTGGTGCTT TGGTGGGTAT CCCAATGCAA 
ACGGCTATTC AAACCGAAAC ACCCCCAGAA ATGCGCGGCA AAGTGTTTGG CCTGCAAAAT 
AATGTGATTA ATATTGCCCT CACCCTACCC CTAGCATTAG CAGGTGTAGC CGAAACCTTT 
CTTGGCTTAC AGTCAGTCTT TTTGGCATTA GCTATCATCG TTTTCTTGGG AGGTATCTTA 
ACCTGGTACA ATTCCCGTGG TTAG

Protein sequence

MQSSDLDRKV PPLSPSQAQN KIRVSESTRL NHLNSVPQSQ PGQINKQEMS VKEVANDQKG 
TTEVNLTDIP KPSALHSDIA LTITEQNGKV NRTQQTLPEA ISTETSQLNG SGSGGETASR 
DVEKQGFFPV LKNPNFLALW GGQIFCQLAD KVYLVLMIAL INSEFQQGGQ SISGWVSALM 
MIFTIPAVLF GSVAGVFVDR WSKKVVLVAS NIWRGILVLA IPFLLWLTYD WQPVGVLPVG 
FLMILAVTFL VSTLTQFFAP AEQAAIPLVV EEQHLLSANS LYTTTMMASV IVGFALGEPV 
LVLADGIWSQ FGGSGGLGKE ILVGGSYAIA GIILLLLRTN EKPNPPETEF PHVFSDLRDG 
LRYLQENQRV RNALLQLIIL FSVFAALTVL AVRMAEIIPN LKASQFGFLL ASGGVGIAGG 
ATILGQFGQR FSYRQLSLWG CLGMAASLFG LSIFTTQLGA VLLLLALVGV FGALVGIPMQ 
TAIQTETPPE MRGKVFGLQN NVINIALTLP LALAGVAETF LGLQSVFLAL AIIVFLGGIL 
TWYNSRG