Gene Haur_2853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2853
Symbol
ID	5736890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3621044
End bp	3622129
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	44%
IMG OID	641279996
Product	peptidase C2 calpain
Protein accession	YP_001545619
Protein GI	159899372
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0973219
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGCGA CCGTTGTAGA GATTAATTAT GCGCAGATGC AACAACTTAG TCAGCGCTTC 
CAACGTCAAG CTGAGGTAGT AAGCCAGTTA CAGCAACAAC TCAATCACAC TTATCAACAA 
TTACAAAACG ATTGGCATGG CGATGCCGCT AAAAGCTTTT TTAATGAAAT GCAAACCAGC 
ATCTTTCCAA CCTTTGGAAA ATTAAAAGAA GTTTTAGTAA CAGCGCAACA AGTCACATTA 
AACGTTAACT CGATTTTACG CGAAGCTGAA ACCGAGGCTG CCAACTTGTT CCAAGGAGCA 
TTTGATGGCG GGGCCGCAGC AGGCAACGGC AAAGGTATCT ATGAGGCTAA TCCTGCTGGA 
AAAAGCAAAT TGGTAACCGA CCCAGAGTAT CGCAAAATTG AGCAGCCAGC GTTTGCTCAA 
GATGCTGACG ATAGCGCCGA TATTGCCATT GATGATGTTA AACAAGGTCA GTTGGGTGAT 
TGCTATTTGA TGGCCGGAAC CGCAGCAATT GCCAATACGC GCCCTGATAT TATTCGCAAT 
GCGATTCGTG ATAATGGCGA TGGAACCTAT ACCGTGACGC TGTATCCAGA AGAAGGTGTT 
TCAGGCTTTT TTGGGATGCG CTCCAAGGTA GAGGTAACTG TAACCAATGA ATTTGTTCAT 
TCAAAAGGTA GCGGTGCGCT TGGTTATGCC CAATTAAGCG ACGAATTTGA AATTTGGCCA 
ATGCTCGTCG AAAAGGCCTA TGCTCAACAT AAAGGCGGCT ATGCCAATAT TGTCAGTGGT 
AATGCAGGCG AGTTTATGGC AATCCTGACT GGCAACGATT CATCGCATAC CGATGTAGAA 
GATGTTGATT TTGCCGATCT CAAAAGCCGC TTGGACAACG GTGCTGCAAT TACTGCCGGA 
ACCCCCGATT CGCTGACGAA TAAACCAGCC GGAGTCCATG CCGATCATGC TTATGTCATT 
AAAAGTATTG ATCCAACCAA TAAAACCGTT ACCTTATATA ACCCTTGGGG TTATGATCAC 
CCAACAATTA CCTTTGATGA ATTTAAAGCC AATTATGAAA CCGTATCAAT TAATGAAAAG 
GATTAA

Protein sequence

MSATVVEINY AQMQQLSQRF QRQAEVVSQL QQQLNHTYQQ LQNDWHGDAA KSFFNEMQTS 
IFPTFGKLKE VLVTAQQVTL NVNSILREAE TEAANLFQGA FDGGAAAGNG KGIYEANPAG 
KSKLVTDPEY RKIEQPAFAQ DADDSADIAI DDVKQGQLGD CYLMAGTAAI ANTRPDIIRN 
AIRDNGDGTY TVTLYPEEGV SGFFGMRSKV EVTVTNEFVH SKGSGALGYA QLSDEFEIWP 
MLVEKAYAQH KGGYANIVSG NAGEFMAILT GNDSSHTDVE DVDFADLKSR LDNGAAITAG 
TPDSLTNKPA GVHADHAYVI KSIDPTNKTV TLYNPWGYDH PTITFDEFKA NYETVSINEK 
D