Gene Aazo_3449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3449
Symbol
ID	9341253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3519896
End bp	3521065
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	37%
IMG OID
Product	cysteine desulfurase
Protein accession	YP_003722206
Protein GI	298492029
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAGTC GTCCTATCTA CCTCGATTGT CACGCTACCA CACCCATAGA TGAACGGGTA 
CTAAATGCAA TGATTCCTTA CTTTACAGAA AAGTTTGGTA ATCCAGCTAG TATTAGTCAT 
GTTTATGGTT GGGAATCAGA AGCCGCTGTT AAACAATCCA GAGATATTTT AGCAACTGCT 
ATTAATGCTA ACCCGGAAGA AATTGTCTTT ACTAGTGGTG CAACAGAAGC TAATAATTTA 
GCCATCAAAG GTGTAGCAGA AGCTTACTTT GCCAAAGGTC AACATATTGT TACAGTTGCA 
ACCGAACATA AAGCGGTTTT AGAGCCTTGT GAATATTTAG AAAGCATGGG TTTTGAAATT 
ATGGTTCTTC CAGTTAATCA AGATGGTCTA ATTGATTTAG AGCAATTAGA AAAAACCTTG 
CGTCATGATA CAATTTTAGT ATCAGTCATG GCTGCAAATA ATGAAATCGG AGTTTTACAA 
CCCTTAGATA AAATCGGTAA AATGTGCCGT CAAAAAGAAA TTATATTTCA TACAGATGCA 
GCTCAAGCCA TTGGTAAAAT TCCCTTAGAT GTAGAAGCAT TAAATATTGA TTTAATGTCC 
TTAACAGCCC ATAAAGTCTA TGGACCAAAA GGTATTGGTG CTTTATATGT TCGCAGACGC 
AACCCCAGAA TTAAACTAGC AGCACAACAG CATGGGGGTG GCCATGAAAG AGGAATGCGT 
TCTGGGACAT TATATACACC CCAAATCGTT GGTTTTGCTA AAGCTGTAGA AATTGCTTTA 
GCAGAACAAG AAACTGAAAA TCAACGCTTA ACAGAACTGC GGGAAAGATT GTGGAAACAG 
TTATCTACTC TGGAGGGAAT TTATATTAAT GGACATCCCC AAAAACGGTT GGCAGGAAAT 
TTAAATATTA GTCTTGAAGG TGTAGATGGT GCTGCACTTT CTTTAGCTTT ACAACCAATG 
GTAGCAGTAT CTTCTGGTTC TGCTTGTTCC TCAAATAATG TTGCACCTTC CTATGTGCTG 
ATAGCTTTAG GTCATCCAGA AAAATTAGCT TATGCTTCCG TGCGATTTGG AATGGGTAGA 
TTTAATACTG TTGAAGAAAT AGATAAAGTA GCAGAACATT TCATTACTAC TGTGAAAAGT 
TTAAGAAGTA CTTCAGTAGT CATTTGTTAG

Protein sequence

MSSRPIYLDC HATTPIDERV LNAMIPYFTE KFGNPASISH VYGWESEAAV KQSRDILATA 
INANPEEIVF TSGATEANNL AIKGVAEAYF AKGQHIVTVA TEHKAVLEPC EYLESMGFEI 
MVLPVNQDGL IDLEQLEKTL RHDTILVSVM AANNEIGVLQ PLDKIGKMCR QKEIIFHTDA 
AQAIGKIPLD VEALNIDLMS LTAHKVYGPK GIGALYVRRR NPRIKLAAQQ HGGGHERGMR 
SGTLYTPQIV GFAKAVEIAL AEQETENQRL TELRERLWKQ LSTLEGIYIN GHPQKRLAGN 
LNISLEGVDG AALSLALQPM VAVSSGSACS SNNVAPSYVL IALGHPEKLA YASVRFGMGR 
FNTVEEIDKV AEHFITTVKS LRSTSVVIC