Gene Ava_4100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4100
Symbol
ID	3681565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5098966
End bp	5099988
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	40%
IMG OID	637719448
Product	SyrP protein, putative
Protein accession	YP_324596
Protein GI	75910300
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2175] Probable taurine catabolism dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAACG TAGAATTACC AACAAACAGT ATTAAAAAAC TACAAATTGG CAAACGCAAA 
GTAGTTGAAA AATTAGTCAA CATAGAACCA CTCAACTCAG ATAATCCTTT ACCTTTAGTT 
ATTTCCCCTG CTGTAGATGG GATGAATTTA ATCAATTGGG CGCAGCAGAA TCGTGATTTA 
ATTGAAACTA ACTTACTGAA AAATGGTGGC ATACTCTTTC GCAATTTTCA TGTTAATACA 
GTTGAAGATT TCCAAAAGTT TGTGAAAGTA GTATCCACCG GAGAACTCTT AGATTACACC 
TATCGCTCAA CGCCACGTAC AGAAGTCACT GATAAAATCT ATACTTCAAC TGAATATCCC 
GCAGATGAAA TCATTCCACT ACATAACGAA AATGCTTACT CTCCCGTTTA TCCCATGAAG 
ATATGGTTTT TCTGTGTGAA AGCATCAGAG ATTGGCGGAG AAACACCAAT CTCTGATAGC 
CGTAAAGTGT TTGAACGCAT TAACCCGTCC ATCAAAAAAC GGTTTATAGA AAAGCAAGTC 
ATGTATGTGC GAAATTATGG CGATGTCGAT TTGCCTTGGC AAGAAGTTTT TCAAACTACA 
AATAAATCTG AGGTAGAAAG TCATTGTCGC CAGTTAGGCA TTTCTTTTGA ATGGACAGGG 
AACAATACTC TCAGAACTAG CCAAGTGTGT CCAGCTGTTG CCAAACACCC GAAAACCAGT 
GAAATGGTAT GGTTTAACCA AGCCCATTTG TTCCATATTT CCAGTTTGAA AGCAGAAGTG 
CGCGAATCAT TATCTGCATT ACTCAAAGAA GATGATTTTC CCCGCAATGC CTATTATGGT 
GATGGTTCTC CCATTGAAGT CTCGGTTTTA GACGAAATCC GGGAAATATA TCGCCAAGAA 
GCAGTAATTT ATCCTTGGCA GGAAGGAGAT GTGTTAATGC TGGACAATAT GTTGGCTGCA 
CATGGAAGGA TGCCATTCGT CGGGAAACGA AAGATTGTAG TGGCGATGGC GGAACCTTGC 
TGA

Protein sequence

MNNVELPTNS IKKLQIGKRK VVEKLVNIEP LNSDNPLPLV ISPAVDGMNL INWAQQNRDL 
IETNLLKNGG ILFRNFHVNT VEDFQKFVKV VSTGELLDYT YRSTPRTEVT DKIYTSTEYP 
ADEIIPLHNE NAYSPVYPMK IWFFCVKASE IGGETPISDS RKVFERINPS IKKRFIEKQV 
MYVRNYGDVD LPWQEVFQTT NKSEVESHCR QLGISFEWTG NNTLRTSQVC PAVAKHPKTS 
EMVWFNQAHL FHISSLKAEV RESLSALLKE DDFPRNAYYG DGSPIEVSVL DEIREIYRQE 
AVIYPWQEGD VLMLDNMLAA HGRMPFVGKR KIVVAMAEPC