Gene Ava_3988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3988
Symbol
ID	3679662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	4958808
End bp	4960511
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	44%
IMG OID	637719340
Product	histidine ammonia-lyase
Protein accession	YP_324488
Protein GI	75910192
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase [TIGR01226] phenylalanine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.488939
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACAC TATCTCAAGC ACAAAGCAAA ACCTCATCTC AACAATTTTC TTTTACTGGA 
AATTCTTCTG CCAATGTAAT TATTGGTAAT CAGAAACTCA CAATCAATGA TGTTGCAAGG 
GTAGCGCGTA ATGGCACCTT AGTGTCTTTA ACCAATAACA CTGATATTTT GCAGGGTATT 
CAGGCATCTT GTGATTACAT TAATAATGCT GTTGAATCTG GGGAACCAAT TTATGGAGTG 
ACATCTGGTT TTGGCGGTAT GGCCAATGTT GCCATATCCC GTGAACAAGC ATCTGAACTC 
CAAACCAACT TAGTTTGGTT CCTGAAAACA GGTGCAGGGA ACAAATTACC CTTGGCGGAT 
GTGCGCGCAG CTATGCTCTT GCGTGCAAAC TCTCATATGC GCGGTGCATC TGGCATCAGA 
TTAGAACTTA TCAAGCGTAT GGAGATTTTC CTTAACGCTG GTGTCACACC ATATGTGTAT 
GAGTTTGGTT CAATTGGTGC AAGTGGTGAT TTAGTGCCAC TATCCTACAT TACTGGTTCA 
CTGATAGGCT TAGATCCCAG TTTTAAGGTT GACTTCAACG GTAAAGAAAT GGATGCGCCA 
ACAGCTCTAC GTCAACTGAA TTTGTCACCC TTGACATTGT TGCCGAAGGA AGGCTTGGCG 
ATGATGAACG GCACTTCAGT CATGACAGGT ATTGCAGCAA ACTGCGTCTA CGATACTCAA 
ATTTTAACTG CGATCGCTAT GGGCGTTCAC GCTCTAGATA TCCAAGCTTT AAACGGAACC 
AATCAATCAT TCCATCCATT TATCCATAAT TCCAAACCAC ATCCTGGTCA ATTATGGGCA 
GCAGATCAGA TGATTTCTTT GTTAGCCAAT TCCCAGTTAG TTCGTGATGA GTTAGATGGT 
AAACACGATT ATCGTGATCA CGAGTTGATT CAAGATCGTT ACTCACTCCG ATGCCTTCCC 
CAGTATTTGG GGCCAATCGT TGATGGAATT TCCCAGATTG CCAAACAAAT TGAAATCGAA 
ATCAACTCAG TCACCGATAA CCCACTAATT GATGTTGATA ACCAAGCTAG CTATCATGGA 
GGAAATTTCC TCGGACAGTA CGTGGGTATG GGAATGGATC ACCTGCGTTA CTATATTGGG 
TTATTGGCTA AACACCTAGA TGTGCAGATT GCCCTCCTCG CCTCACCAGA GTTTAGCAAT 
GGACTACCAC CATCTTTATT AGGCAACCGA GAACGTAAAG TCAATATGGG ACTCAAAGGT 
CTGCAAATAT GCGGTAACTC AATTATGCCA CTGTTGACCT TCTATGGAAA TTCCATCGCC 
GATCGCTTTC CTACCCATGC AGAACAATTT AATCAGAACA TCAACAGTCA AGGATACACT 
TCAGCGACTC TAGCCCGCCG TTCTGTGGAT ATCTTCCAGA ATTATGTGGC GATCGCTCTG 
ATGTTTGGAG TCCAAGCTGT TGACCTCCGC ACATATAAAA AGACTGGTCA TTACGATGCA 
CGCGCCTGTC TATCACCTGC AACTGAGCGC TTATATTCAG CAGTCCGCCA CGTAGTTGGA 
CAAAAACCAA CTTCAGATCG CCCATATATT TGGAATGATA ATGAGCAAGG ACTGGATGAG 
CATATTGCCC GGATTTCTGC TGATATCGCT GCTGGTGGTG TGATTGTGCA AGCAGTTCAA 
GATATCTTAC CCTGCTTGCA TTAA

Protein sequence

MKTLSQAQSK TSSQQFSFTG NSSANVIIGN QKLTINDVAR VARNGTLVSL TNNTDILQGI 
QASCDYINNA VESGEPIYGV TSGFGGMANV AISREQASEL QTNLVWFLKT GAGNKLPLAD 
VRAAMLLRAN SHMRGASGIR LELIKRMEIF LNAGVTPYVY EFGSIGASGD LVPLSYITGS 
LIGLDPSFKV DFNGKEMDAP TALRQLNLSP LTLLPKEGLA MMNGTSVMTG IAANCVYDTQ 
ILTAIAMGVH ALDIQALNGT NQSFHPFIHN SKPHPGQLWA ADQMISLLAN SQLVRDELDG 
KHDYRDHELI QDRYSLRCLP QYLGPIVDGI SQIAKQIEIE INSVTDNPLI DVDNQASYHG 
GNFLGQYVGM GMDHLRYYIG LLAKHLDVQI ALLASPEFSN GLPPSLLGNR ERKVNMGLKG 
LQICGNSIMP LLTFYGNSIA DRFPTHAEQF NQNINSQGYT SATLARRSVD IFQNYVAIAL 
MFGVQAVDLR TYKKTGHYDA RACLSPATER LYSAVRHVVG QKPTSDRPYI WNDNEQGLDE 
HIARISADIA AGGVIVQAVQ DILPCLH