Gene Paes_0994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_0994
Symbol
ID	6458701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	1091955
End bp	1093016
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	52%
IMG OID	642724993
Product	Cytochrome-c peroxidase
Protein accession	YP_002015680
Protein GI	194333820
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTTA CTACTTTCCT CGGTGCCCTG ACTACGCTTG CAGTCACCAC CTCGTGTACT 
CCTGACACAG AGCAGCAGAA CAACTCAAAA AGCGCTCAAA AGCCTGCCGC AGAGCAAGAG 
ATTTCCGTCA TGCGAAACGA ACCGGTAAAG CCACTTGAAC CGGCGATAAT TACCGATACT 
GCAATGGTAG AACTTGGCAA AAAACTCTAT TTCGACCCAA GGCTATCGCT CTCCGGATTT 
ATCTCCTGTA ACTCATGTCA CAACCTCAGT ATGGGAGGAA GTGACAACTT GAAAAGCTCG 
ATCGGGCATA AATGGAGTAG AGGACCTATC AACTCGCCGA CCGTCCTGAA CTCGAACCTG 
AACCTGGCAC AATTCTGGGA TGGAAGAGCA AAAGACCTTA AAGAACAGGC AGGGGGGCCG 
ATAGCCAATC CTGGAGAGAT GGCATTCACC CATGAACTTG CCGTCGAGCT CTTGCAATCG 
ATTCCCGGTT ACGTCGATGA ATTTCACCAG GTGTTCGCCA CCACCAGCAT TGACATCGAC 
CAGGTCACGA CAGCCATTGC AGCTTTTGAA GAAACCCTCG TCACACCCGA TTCGCGATTC 
GACCTCTGGC TTAAAGGCGA TGACAGCGCC ATCAATGAAA CGGAACTGAA AGGATACGCG 
CTCTTCAAGT CAAGCGGATG TAGCGCTTGC CATAACGGAC CGGCGCTTGG AGGAAACTCT 
TTCCAGAAAA TGGGACTTGT TGCCCCATAC AAGGCAACAA GTCCTGTCGA AGGACGTTCG 
GCAGTAACCG GAAAGGATGC CGACCGGTTC TCCTTCAAAG TCCCAACCCT GCGAAATGTC 
GAGCTGACCT ATCCGTATTT TCATGACGGC GAGGCGGAAA CACTGGCAGA AGCAGTCGAA 
ATCATGGGCA GAATTCAGCT GGGAAGAACC TTCACCGAGG AGGAAAATGA GCAGATTGTC 
GCGTTTCTGA AAACCCTGAC CGGCACCCAG CCCAGGATGG AACTACCACT TCTCCCGCCA 
TCATCAGATA CAACCCCGAG ACCCGATCCG TTCAGCGACT GA

Protein sequence

MKLTTFLGAL TTLAVTTSCT PDTEQQNNSK SAQKPAAEQE ISVMRNEPVK PLEPAIITDT 
AMVELGKKLY FDPRLSLSGF ISCNSCHNLS MGGSDNLKSS IGHKWSRGPI NSPTVLNSNL 
NLAQFWDGRA KDLKEQAGGP IANPGEMAFT HELAVELLQS IPGYVDEFHQ VFATTSIDID 
QVTTAIAAFE ETLVTPDSRF DLWLKGDDSA INETELKGYA LFKSSGCSAC HNGPALGGNS 
FQKMGLVAPY KATSPVEGRS AVTGKDADRF SFKVPTLRNV ELTYPYFHDG EAETLAEAVE 
IMGRIQLGRT FTEEENEQIV AFLKTLTGTQ PRMELPLLPP SSDTTPRPDP FSD