Gene Aazo_4100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4100
Symbol
ID	9341905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	4167359
End bp	4169338
Gene Length	1980 bp
Protein Length	659 aa
Translation table	11
GC content	40%
IMG OID
Product	ABC-1 domain-containing protein
Protein accession	YP_003722670
Protein GI	298492493
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGTTA AGAGTTTCAC ACCTCCTAGT TCCCAATCGA GTGTGCAGGA CAGTGGCAAC 
AGCAAGTTGT CGGTTATTGA AGTAGTACCT GAAAATGGGA TAGGAGCCTT AGTCAGCAGT 
TCTCCCACAA TCTTAAGAAC TACACAAGCT GAACCGGAAA TACTGCGTTA TGATCCTGTA 
GAAATCCTAG CGCACTATGA AAATAAACTT TTACAAGTGT TACGCCGGAC TTTGGCAGTT 
CTGCAACCAA CTTTGTCTTA TGTTTTCGGT TTGTGGTTGG ATAATAAACG GGGTGTTAAG 
GTCAAAAATG ACCGTAGTCG GGCTATTCAA CTGCGAGAGT TGTTGACTAA GCTGGGACCT 
GCTTATATTA AAATCGGACA GGCTTTGTCT ACTCGGCCTG ATTTGGTGCC ACCAGTATAT 
CTGGAGGAGT TAACTAGACT GCAAGACCAA TTACCAGCGT TTCCGAATGA AATTGCTTAC 
CAGTTTATTG AGGAGGAACT GGGGGCTAAA CCAGAGGAAA TTTATGCGGA AGTTTCACCT 
GAACCTATTG CTGCTGCTTC TTTAGGACAG GTATACAAGG GGAAGCTTAA AACTGGGGAA 
GAGGTGGCTA TTAAGGTACA GCGCCCAGAT TTACGAGAAA TAATTACTAT TGATTTGTAT 
ATTTTACGCC GCCTTGCTGG TTGGGTACAA CGGAAGGTGA AGCGGGTACG GAGTGATTTA 
GTTGGCATTT TGGATGAGTT GGGCGATCGC ATTTTTGAAG AAATGGATTA TATCCATGAA 
GGTGAAAATG CGGAACGCTT CTTTGAATTA TACGGGCATA TTCAAGATAT CTACGTTCCC 
AAAATTTATT GGGAATACAC TAACCGTCGT GTTTTAACGA TGGAGTGGAT TAAGGGGATT 
AAATTAACTC AAACCAGTGA AATTAAGGAA CTAGGAATAG ATGCACGCTA TTTAATTGAA 
GTGGGTGTGC AGTGTTCTTT GCGTCAATTA TTGGAACATG GATTTTTCCA TGCTGACCCT 
CATCCTGGTA ATTTGTTAGC TACTTTTGAT GGTAAGTTGG CTTATCTAGA CTTTGGGATG 
ATGAGCGAAA TTAGGCCACC ACAGCGTTAT GGTTTAATTG AGGCGATCGT TCACGTTGTC 
AACCGTGATT TTGACTCTTT AGCACAAGAT TATGTGAAAT TAGAGTTTCT TTCTCCAGAA 
ACAGATTTAA CACCAATTAT TCCTGCTTTT GGCAAAGTTT TTGCTAACGC TCAAGGTGCA 
AGTGTAGCAG AATTAAACAT TAAAAGCATC ACAGATGATT TATCGGCATT AATGTATGAG 
TATCCTTTCC GCGTTCCTCC TTATTACGCT TTAATTATTC GTTCTTTGGT GACATTGGAA 
GGGATTGCTA TCTATATTGA TCCTAACTTT AAAGTTCTCA GTGAAGCTTA TCCTTATGTT 
TCTAAACGCC TGTTAACTGA CCCAGCGGAC GAATTAAGAA CTTCATTACG AGATTTACTT 
TTTAAAGATG GTAAATTCCG GTGGAATCGT TTAGAAAATT TGTTAAAAAA TGCCCGTAGT 
AATCAGGATT ACGACTTTAA TTTAGTAGTG TCTCAGGGAA TAGACTTTTT ATCTTCTGAA 
CGGGGAGCAT TTATTCGTGA CAGGTTGGTT GATGAGTTTA TAAATGGACT CGATGCCATG 
AGTAAAAATG CCTTACATGG TGTTACATCA CTATTGCGGG AAAGAGTGGG ATTAACAGCT 
ATTAGTGAAA CTCCTCGGGC TACAGTTGAA CAACAACAAA CCTTAGAACA TATCAAACGC 
ATTGTGGGGA TTTTGCGAGA AACTAGAGGT TTTGATCCGG CAAAACTCGC TCCTCAAATA 
GCGCAAATTT TTGTGAATCC TAAAGTACAA AATTTGGGGC AACAAATTGC CCATCGTTTT 
ACACAGAAAG CTTTAGCTAA GTTGATTAGA CAATTATTAG CAGCAGAAGA AATTGGGTAA

Protein sequence

MMVKSFTPPS SQSSVQDSGN SKLSVIEVVP ENGIGALVSS SPTILRTTQA EPEILRYDPV 
EILAHYENKL LQVLRRTLAV LQPTLSYVFG LWLDNKRGVK VKNDRSRAIQ LRELLTKLGP 
AYIKIGQALS TRPDLVPPVY LEELTRLQDQ LPAFPNEIAY QFIEEELGAK PEEIYAEVSP 
EPIAAASLGQ VYKGKLKTGE EVAIKVQRPD LREIITIDLY ILRRLAGWVQ RKVKRVRSDL 
VGILDELGDR IFEEMDYIHE GENAERFFEL YGHIQDIYVP KIYWEYTNRR VLTMEWIKGI 
KLTQTSEIKE LGIDARYLIE VGVQCSLRQL LEHGFFHADP HPGNLLATFD GKLAYLDFGM 
MSEIRPPQRY GLIEAIVHVV NRDFDSLAQD YVKLEFLSPE TDLTPIIPAF GKVFANAQGA 
SVAELNIKSI TDDLSALMYE YPFRVPPYYA LIIRSLVTLE GIAIYIDPNF KVLSEAYPYV 
SKRLLTDPAD ELRTSLRDLL FKDGKFRWNR LENLLKNARS NQDYDFNLVV SQGIDFLSSE 
RGAFIRDRLV DEFINGLDAM SKNALHGVTS LLRERVGLTA ISETPRATVE QQQTLEHIKR 
IVGILRETRG FDPAKLAPQI AQIFVNPKVQ NLGQQIAHRF TQKALAKLIR QLLAAEEIG