Gene Aazo_4767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4767
Symbol
ID	9342574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	4866955
End bp	4868271
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	43%
IMG OID
Product	gid protein
Protein accession	YP_003723068
Protein GI	298492891
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAAC AACCGATACA AGTAATTGGC GGTGGACTAG CGGGAACAGA AGCGGCGTGG 
CAAATTGCCC AAGCTGGCAT TCCTGTAATT CTCCACGAGA TGCGTCCTAA ACGCTTCAGC 
CCTGCCCATC ATACCGAAAA TTTGGCAGAA TTGGTATGTA GTAACTCTTT CGGGTCCATG 
GCGAGCGATC GCGCGGCAGG ATTATTACAC GAAGAATTAC GTCAACTCGG TTCTATTGTT 
ATTGCTAAAG CTGACGAACA CGCAGTCCCC GCTGGTGGTG CATTAGCAGT AGACAGAGCA 
CAATTTGGGG AAGATTTAAC CCAAACGTTA GCAAATCATC CTTTAATTGA TTTCCGACGG 
GGAGAAGTGA CAGCAATTCC CGAAGGTATT GTAGCTTTGG CAAGTGGTCC TTTAACCAGT 
CCCGATTTAT CCGCAGATTT ACAACGATTT ACCGGGATGG AATATCTCAA TTTCTTTGAT 
GCTGCCAGTC CTATTATTGT TGGAGATTCT ATTAATAAAG ATGTTGCATT TATGGCTTCC 
CGTTATGACA AAGGTGAAGG AGCTTATCTT AATTGTCCCA TGAATAAAGA GCAGTATTTA 
CATTTTTGGG AGGAATTACG TAAAGCCGAA CAAACAGAAT TAAAAGACTT TGAAAAGGAA 
ACAGCAAAAT TTTTTGAAGC TTGTTTACCG ATTGAAGAAA TGGCACGACG GGGGGAAGAC 
ACCATGCGTT ATGGACCTCT CAAACCGGTG GGTTTATCGG ATAGTCGCAC AGGAGAAAGT 
CCTTATGCGG TAATTCAATT AAGACAAGAA GATAAAGCCC ATCAACTTTG GAATATGGTA 
GGATTCCAAA CTAATCTGCG GTGGGGTGAA CAAAAGCGCG TATTCCAAAT GATTCCTGGT 
TTGGAAAAAG CCGAATTTGT CAGATTAGGA GTCATGCACC GCAATACCTT TTTAAATGCA 
CCACAGTTAA TGTCTGCAAG TTTGCAATTT AAAGAACGTC CAACTTTATT AGCTGCGGGA 
CAATTAATAG GAACAGAAGG TTATACTGCT GCATCTGCGG GTGGTTGGTT AGCGGGAACA 
AATGCAGCGC GGTTAGCTTT GGGTAAAGAA CCTCTAATTC TGCCTGTAAC AACGATGATG 
GGGGCTTTGT TTGAGTTTAT CAGATCCGCT TCACCTAAGC ATTTTCAACC GATGGCTCCT 
AATTTCGGCA TTTTGCCAGA TTTGGGAGTG AAAATCAAGA GTAAACCGGA AAAATATGGA 
CGTTATCGCG ATCGCGCTTT GGCAGATTTA GCAAATTGGA AAGTTAACCA CTTATAA

Protein sequence

MTQQPIQVIG GGLAGTEAAW QIAQAGIPVI LHEMRPKRFS PAHHTENLAE LVCSNSFGSM 
ASDRAAGLLH EELRQLGSIV IAKADEHAVP AGGALAVDRA QFGEDLTQTL ANHPLIDFRR 
GEVTAIPEGI VALASGPLTS PDLSADLQRF TGMEYLNFFD AASPIIVGDS INKDVAFMAS 
RYDKGEGAYL NCPMNKEQYL HFWEELRKAE QTELKDFEKE TAKFFEACLP IEEMARRGED 
TMRYGPLKPV GLSDSRTGES PYAVIQLRQE DKAHQLWNMV GFQTNLRWGE QKRVFQMIPG 
LEKAEFVRLG VMHRNTFLNA PQLMSASLQF KERPTLLAAG QLIGTEGYTA ASAGGWLAGT 
NAARLALGKE PLILPVTTMM GALFEFIRSA SPKHFQPMAP NFGILPDLGV KIKSKPEKYG 
RYRDRALADL ANWKVNHL