Gene Aazo_4790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4790
Symbol
ID	9342597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4892988
End bp	4894841
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	41%
IMG OID
Product	ABC transporter-like protein protein
Protein accession	YP_003723087
Protein GI	298492910
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.918505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAA CTATCCTAGA GGTTCGCAAT CTACAAGTTG AGTTTTCCGG TGATGACAGC 
GCAGTTAAAG CTGTAGATGG GATTAGCTTT GAATTAAATC GAGGTGAGAC TCTAGGAATA 
GTGGGAGAGT CTGGGAGTGG TAAATCAGTA ACCGCTTTAG CTGTGATGGG TTTGTTGCAA 
TATCCCGGTA AAGCTAATGA AGGACAAATC TGGTTTCGTC CGCAGGAAAA TGCCGAACCG 
CTGGATTTAC TGGCTTTACC TACCCAAGAA ATGCAGCTTT ACCGGGGTGG TGATATTGCT 
ATGATTTTTC AAGAACCGAT GAGTTCTCTC AACCCGGTTT ATGATATTGG GTTTCAGCTG 
ACAGAAGCAA TTATGCGTCA TCAAAATGTC AATGCAGTTG AAGCCAAGAG AATTGCGATC 
GCAGGTCTAC AAGAAGTTAA ACTTTTACCT AGTGACCAAG AAATTCAAGA GCAATATCTT 
GATAGTAGCC AGTTAACTGA CTCTAAATTA TCTCCAAGCA GTGATTATCA AATAGCTCAG 
TTGGTGAAAG AACACAAAGA AGCGATGTTG AAACGCTATC CCCATCAACT TTCTGGGGGT 
CAGTTACAAC GGGTGATGAT TGCAATGGCA ATTTCTTGTA ACCCATCACT GTTAATTGCT 
GATGAACCGA CCACAGCTTT AGATGTGACA GTACAAGCAA CCATTATTGA GTTGATGCGG 
GAATTGCAGC AAAAACGCAA CATGGGGATG ATTTTTATTA GTCATGACTT GAGTTTAATC 
GCGCAAATTG CTGACCAAGT AGGGGTGATG TACAAAGGTA AAATTGTGGA ATATGGTGCA 
GTATCGCAAA TTTTTAGTAA TCCCCAACAT CCCTATACTA GAGGTTTGGT AGCTTGTCGT 
CCTACTCTAC ATTGTCGTCC GCACAAACTC CTCACAGTTT CTGATTACAT GAGTTTACAG 
GAAGATGAAA GTGGACAGCT AGTAATTCGA GCCAAAGAAC CAGCAAAACC ACCGCAAATT 
ACTCAGGAAG AACTTAACCA AAGATTGGCA AATCTGCAAG AGAAATCTCC CCTTTTACAA 
ATTCATCATC TCAAAGTTGG GTTTCCTGTG CGGGGAGTGT TTGGCGGCAC AAAACGCTAC 
AATATAGCAG TGAATTCTGT TTCTTTTGAT GTTTATCCAG GCGAAACTTT GGGATTGGTA 
GGAGAATCTG GTTGTGGTAA AACCACTTTG GGTAGAAGTC TGCTCAGATT AATTGAACCC 
ATGAGCGGTC AAATTACTTT TAAAGGACAA AATATCACTC ACCTTAAAGG AGAATCGTTG 
CAAAAATTGC GGCGAGAAAT GCAAATTGTT TTTCAAAATC CTTTTAGTTC CCTTGACCCC 
CGGATGAAAA TTGGTGATGC AGTTATGGAA CCATTGTTGA TTCATGGTGT GGGTAAATCA 
AAACAACAGC GAAAAGAAAG AACTATACAA CTTTTAGAAC GGGTGGGATT GAGTGCGGAT 
GATATGAAAC GCTATCCCCA TCAGTTTTCA GGTGGTCAAC GTCAACGGAT TTGTATTGCG 
CGGTCGTTGG CTTTAAATCC TCAGTTTATT ATTTGTGATG AGTCGGTTTC GGCTTTGGAT 
GTTTCGGTAC AAGCACAAGT TTTGAATTTG TTAAAAGAAT TGCAAAGGGA TTTTAATTTG 
ACGTATATTT TCATTTCCCA TGATTTAAGT GTGGTCAAAT TTATGAGTGA TCGCATTTTG 
GTAATGAATC AAGGGAAAAT AGTGGAAGAA GGGACATCAG AAAGCATTTA TCTTCAACCC 
AAAGAAGAAT ATACGCAGAA ATTAATCGCG GCTATTCCGA CAGGGAATAA GTGA

Protein sequence

MKETILEVRN LQVEFSGDDS AVKAVDGISF ELNRGETLGI VGESGSGKSV TALAVMGLLQ 
YPGKANEGQI WFRPQENAEP LDLLALPTQE MQLYRGGDIA MIFQEPMSSL NPVYDIGFQL 
TEAIMRHQNV NAVEAKRIAI AGLQEVKLLP SDQEIQEQYL DSSQLTDSKL SPSSDYQIAQ 
LVKEHKEAML KRYPHQLSGG QLQRVMIAMA ISCNPSLLIA DEPTTALDVT VQATIIELMR 
ELQQKRNMGM IFISHDLSLI AQIADQVGVM YKGKIVEYGA VSQIFSNPQH PYTRGLVACR 
PTLHCRPHKL LTVSDYMSLQ EDESGQLVIR AKEPAKPPQI TQEELNQRLA NLQEKSPLLQ 
IHHLKVGFPV RGVFGGTKRY NIAVNSVSFD VYPGETLGLV GESGCGKTTL GRSLLRLIEP 
MSGQITFKGQ NITHLKGESL QKLRREMQIV FQNPFSSLDP RMKIGDAVME PLLIHGVGKS 
KQQRKERTIQ LLERVGLSAD DMKRYPHQFS GGQRQRICIA RSLALNPQFI ICDESVSALD 
VSVQAQVLNL LKELQRDFNL TYIFISHDLS VVKFMSDRIL VMNQGKIVEE GTSESIYLQP 
KEEYTQKLIA AIPTGNK