Gene Ava_2341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_2341
Symbol
ID	3683456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	2904514
End bp	2905794
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	45%
IMG OID	637717686
Product	peptidase M16-like
Protein accession	YP_322854
Protein GI	75908558
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCAA CCCTGCGGAA ATTGCCCCGA CTTAATGCCC CAAAACTACA TACACTACCC 
AATGGTTTGA CCATCATAGT GGAGCAAATG CCAGTTGAAG CCGTGAATCT CAGCTTGTGG 
ATTGATGTTG GCTCATCTGT AGAATCTGAT GCCATTAACG GTATGGCTCA CTTTTTAGAA 
CACATGATTT TTAAAGGAAC TGAGCGCCTT GCCAGTGGTG AGTTTGAACG TCACATAGAA 
GAGCGAGGTG CTGTTACTAA CGCCGCTACC AGTCAAGACT ACACTCATTA CTATATAAAT 
ACTGCTCCTC AAGATTTTGC CAAATTAGCG CCATTACAAA TAGATGTAGT TTTAAATGCA 
AGTATCCCTG ATGAAGCCTT TGAACGTGAG CGCTTTGTCG TGTTGGAAGA AATCAAACGT 
TCCGAAGATA ATCCCCGTCG CCGTACCTTC CGCCGGGCAA TGGAAACAGC ATTTGCAGAG 
TTACCCTACC GCCGTCCAGT ATTGGGGCCA GAGTCGGTAA TTTCCCAACT AACACCCCAA 
CAGATGCGAG ATTTTCACGC TAGTTGGTAT CAACCCCAGT CAATCACGGC TGTAGCTGTA 
GGTAATTTAC CGGAAGAACA GTTAATTGAA ACTATTGTCG AAGGATTTAA CCAACTCAAA 
AAAACTCCCC CATCCCCACT CCCCACTCCC CGCCCCCTCA ATCTCGAACC TGCATTTACA 
GAAATTGTGC GTCGGGAATT TGTAGATGAA AGTCTTCAGC AAGCAAGACT GATCATGGTT 
TGGCGAGTTC CTGGGTTGAA CCAACTAGAA CAGACTTATG GCTTAGATGT TTTAGCGGGT 
ATTTTGGCAC ATGGAAGAAC ATCAAGGCTA GTGCAGGATT TACGGGAAGA ACGAGGACTT 
GTAACTTCGA TTTCTGTCAG CAATATGAGT AATCGTTTGC AAGGGACATT TTATATTTCC 
GCTAAATGCG CCGTAGAAGA TTTACAAGCC GTAGAGGAAG CGATCGCTCA ACATATCCGT 
AAACTACAAA CAGAGTTAGT CACAGAAAAA GAAATCGCCC GTGTCCGTAA GCGTGTAGCC 
AACAGATTTA TTTTTGGCAA CGAAACACCA AGCGATCGCG CTGGATTATA TGGATTCTAT 
CAATCACTGG TAGGAGATTT AGAACCAGCA TTTAACTACC CAGCCCACAT TCAAACCCAA 
GAAGCACCAG ATTTACTCTT GGCTGCTAAC CAGTATCTTT GCCCAGAGGC TTATGGTGTG 
GTTGTCATGA AACCAGCGTA G

Protein sequence

MTSTLRKLPR LNAPKLHTLP NGLTIIVEQM PVEAVNLSLW IDVGSSVESD AINGMAHFLE 
HMIFKGTERL ASGEFERHIE ERGAVTNAAT SQDYTHYYIN TAPQDFAKLA PLQIDVVLNA 
SIPDEAFERE RFVVLEEIKR SEDNPRRRTF RRAMETAFAE LPYRRPVLGP ESVISQLTPQ 
QMRDFHASWY QPQSITAVAV GNLPEEQLIE TIVEGFNQLK KTPPSPLPTP RPLNLEPAFT 
EIVRREFVDE SLQQARLIMV WRVPGLNQLE QTYGLDVLAG ILAHGRTSRL VQDLREERGL 
VTSISVSNMS NRLQGTFYIS AKCAVEDLQA VEEAIAQHIR KLQTELVTEK EIARVRKRVA 
NRFIFGNETP SDRAGLYGFY QSLVGDLEPA FNYPAHIQTQ EAPDLLLAAN QYLCPEAYGV 
VVMKPA