Gene Aazo_3745 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3745
Symbol
ID	9341550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3805535
End bp	3806692
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	41%
IMG OID
Product	group 1 glycosyl transferase
Protein accession	YP_003722411
Protein GI	298492234
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATTG CCCTATTCAC CGAAACTTTT TTACCCAAGG TTGATGGGAT TGTTACCCGT 
CTACGTCACA CTGTTGATCA TCTCCAACGG GATGGAAATC AAGTCTTAGT ATTTGCCCCG 
GAAGGTGGAA TTACAGAACA CAAAGGAGCG AAAGTTTTCG GAGTTAGTGG TTTTCCTTTA 
CCTCTTTATC CAGAGTTAAA ATTAGCTCTG CCTCGTCCTG CCATTGGTCA TGCTTTAGAA 
GAGTTTCAAC CGGATATTAT TCATGTTGTC AATCCTGCCG TTTTGGGATT ATCGGGTATT 
TTTCATAGTA AAGTCTTAAA AATTCCTTTG ATCGCTTCTT ACCATACCCA TTTACCTCAA 
TATCTACAAC ATTACGGTTT GGGGATGCTA GAAGGATTAC TATGGGAATT GCTTAAAGCT 
GGACACAATC AAGCAGCCTT AAATTTGTGT ACCTCGACAG CGATGATAGA AGAACTCTCT 
GAACATGGGA TTGAAAGATT AGATTTGTGG CAACGGGGAG TAGATACAGA ATTATTCCAT 
CCTAATTTAG CCAGCGAGGA AATGCGATTA CACCTCACGC AAAATCATCC AAAAAGCCCC 
TTGTTGCTGT ATGTTGGTCG TCTTTCAGCC GAAAAAGAAG TTGAACGCAT TAAACCCATC 
TTAGAAGCCA TTCCTGATGC ACGATTGGCA TTAGTAGGAG ATGGACCAAA CCGCCAAAAT 
TTAGAAAGGC ATTTTGCAGG TACAAATACT CATTTTGTTG GTTATCTGAT GGGTAAAGAG 
TTGGGTTCAG CTTTTGCCAG TGCGGATGCT TTTATTTTTC CTTCCCGTAC AGAAACATTA 
GGCTTAGTGC TACTAGAAGC AATGGCCGCA GGTTGTCCAG TAGTTGCAGC CCGTTCAGGT 
GGCATTCCTG ACATTGTTAC AGATGGTATA AATGGTTATC TTTTTAACCC AAAAGCTGAT 
ATTCAAGAGG CTATTGATGT TACTATCAAG TTGTTAAAAC AAAGACAAGA AATAGCGATT 
ATCCGTAAAA ACGCCCATAC AGAAGCAGAA AAATGGGGAT GGGCTGCTGC TACACGACAA 
CTACAAGATT ACTATCAAAA GGTAATAGGA GTCAGGAATC AGGAGTCAGG AGTCAGGAGT 
CAGGAGAAGA TTCATTAA

Protein sequence

MRIALFTETF LPKVDGIVTR LRHTVDHLQR DGNQVLVFAP EGGITEHKGA KVFGVSGFPL 
PLYPELKLAL PRPAIGHALE EFQPDIIHVV NPAVLGLSGI FHSKVLKIPL IASYHTHLPQ 
YLQHYGLGML EGLLWELLKA GHNQAALNLC TSTAMIEELS EHGIERLDLW QRGVDTELFH 
PNLASEEMRL HLTQNHPKSP LLLYVGRLSA EKEVERIKPI LEAIPDARLA LVGDGPNRQN 
LERHFAGTNT HFVGYLMGKE LGSAFASADA FIFPSRTETL GLVLLEAMAA GCPVVAARSG 
GIPDIVTDGI NGYLFNPKAD IQEAIDVTIK LLKQRQEIAI IRKNAHTEAE KWGWAAATRQ 
LQDYYQKVIG VRNQESGVRS QEKIH