Gene Ava_0437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0437
Symbol
ID	3682598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	557186
End bp	558352
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	45%
IMG OID	637715766
Product	aromatic amino acid beta-eliminating lyase/threonine aldolase
Protein accession	YP_320958
Protein GI	75906662
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00696357
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.223385
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAATC GTCCTATATA TCTTGATTGT CACGCTACCA CACCTCTAGA TGAACAAGTA 
TTAGCAGCAA TGCTACCTTA CTTTACGGAA AAATTTGGCA ACCCGGCTAG TATCGGCCAT 
ATTTATGGTT GGGAAGCAGA GGCGGCTGTG AAACAAGCAC GGGAAATTTT AGCAGCAGCA 
ATTAACGCTA GTCCAGAAGA AATTGTCTTT ACTAGTGGGG CTACAGAAGC GAATAATTTA 
GCGATTAAAG GTGTGGCTGA GGCTTATTTT CAAAAAGGTC AGCATATTAT CACTGTTGCC 
ACTGAACATC ATGCTGTACT TGACCCTTGT GAATATTTAA AAACCCTTGG TTTTGAGATA 
ACTATTTTGC CAGTCCAAGC AGATGGATTA ATTGATTTAG CCCAATTAGA AAAAGCGTTG 
CGTCCTGAGA CAATTTTAGT ATCGGTGATG GCGGCTAATA ACGAAATTGG GGTGTTGCAA 
CCTTTGGCAG AAATTGGGGA AATATGCCGC AGTCACAATA TAATTTTTCA CACAGATGCA 
GCCCAAGCTA TTGGCAAAAT TCCTCTCGAT GTGCAAGCGA TGAACATCGA TTTGATGTCT 
CTGACAGCCC ACAAAGTTTA CGGGCCTAAG GGTATTGGTG CATTATACGT CCGCAGGCGC 
AATCCCAGAG TCCAACTCGC ACCCCAGCAG CATGGCGGCG GACATGAACG GGGAATGCGT 
TCTGGGACGT TGTATACACC GCAAATTGTC GGTTTTGCCA AAGCTGTAGA AATCGCCCTC 
GCAGAACAGA CAATGGAAAA TCAGCGCCTT ACCCAGCTAA GGGATAGATT GTGGTCACAA 
CTTGCACAAT TGGAAGGAAT ACACCTCAAC GGACATCCCA CCCAGAGACT AGCCGGAAAC 
TTGAATATCA GCATTGAAGG GGTGGACGGT GCTGCACTCC AGTTGGGTTT ACAGCCTGTT 
GTGGCGGTGT CTTCTGGTTC TGCTTGTTCC TCCACCAAAA CTGCGCCCTC CCACGTCCTC 
ACAGCTTTAG GAAGTCCAGA AAAACTAGCC TATGCTTCTA TTCGCTTCGG TATTGGACGC 
TTTAATACAG CAGAAGAAAT TGATATAGTA GCGAAATATG CGATCGCTAC TATTCAAAGT 
TTACGTAAAC AAGCAAGTTT GGTATAG

Protein sequence

MSNRPIYLDC HATTPLDEQV LAAMLPYFTE KFGNPASIGH IYGWEAEAAV KQAREILAAA 
INASPEEIVF TSGATEANNL AIKGVAEAYF QKGQHIITVA TEHHAVLDPC EYLKTLGFEI 
TILPVQADGL IDLAQLEKAL RPETILVSVM AANNEIGVLQ PLAEIGEICR SHNIIFHTDA 
AQAIGKIPLD VQAMNIDLMS LTAHKVYGPK GIGALYVRRR NPRVQLAPQQ HGGGHERGMR 
SGTLYTPQIV GFAKAVEIAL AEQTMENQRL TQLRDRLWSQ LAQLEGIHLN GHPTQRLAGN 
LNISIEGVDG AALQLGLQPV VAVSSGSACS STKTAPSHVL TALGSPEKLA YASIRFGIGR 
FNTAEEIDIV AKYAIATIQS LRKQASLV