Gene Paes_1233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1233
Symbol
ID	6459490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	1340537
End bp	1341781
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	49%
IMG OID	642725221
Product	hypothetical protein
Protein accession	YP_002015906
Protein GI	194334046
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0143332
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.037479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATGA AGAAACGATT TTTCCCACTT ACTGTTGCCG CATTTGCAGC AATCGGCAGT 
TCTTTACTCC CGGCAACTTT CCTCAACGCC GGATCAAGTC CACCCGGCAA TACAGGGCAG 
GAAGAGAGTC TTACTCAAAA GGCGATGGAA GAGTATGGTC GGCACTATGC CAATCTCATG 
CTGGTCGAGC AACACCGCCC TTACGATGAG AAGCTGGTGC AGATCGCTCT CCTGCTGGAT 
ACAAGCAACA GTATGGACGG GCTGATCAAC CAGGCTAAAA GCCAGTTGTG GCGGATTGTC 
AATGAACTTT CCAGGGCGCA TAAGCGGGGG AACGATATAC GACTTGAAGT TGCACTTTAT 
GAATACGGCA ATGATCGCCT TGCGATGACG GCCGGCTATA TTCGTCAGGT GACGCCGTTT 
ACCGAAGATC TTGACTGGTT GTCCGAGGCG CTTTTTTCCC TTCAGACAAA CGGTGGTTCC 
GAGTATTGCG GTCATGTTAT CGGGAGCAGT CTTAACCAGT TGGGATGGAA CCGGTCGGGA 
GATGGACTGA AGATGATATT TATTGCAGGT AATGAGCCTT TTAATCAGGG TTCGGTGAAC 
TACGAGGTTT CCTGCCGCTG GGCTGTCGAG AGAGAGATTG TTGTGAATAC CATCTATTGC 
GGGCCCTATC AGAGAGGCAT TGACACACTC TGGCAGCAAG GTGCCAATAA AGGCGGAGGC 
AGTTATTTCG CCATAGACAG TGACAAAGTC CTGAAGGGGA TCGTAACGCC TTATGATGAT 
GATCTTCTGA AGCTGAACAG CGCAATCAAT AGTACCTATA TCCCGTATGG AAGCAAGGGT 
GAGCAGAACC TTTCCCGTCA GGCTGAGCAG GATATGAATG CCTCAAAGCT TTCCCCATCC 
ATTTCTGCGG CAAGAGCCGC TTCAAAAGGT TCGAAACTCT ACAAGGCGTC AGACTGGGAT 
CTGGTTGACG CCCTTGAAGA AAAGAAAATA TCGATTGAAA ATATAAGCAG GGATGCTCTG 
CCGAAAGAGC TGCAGGAGAT GAGGCCTGAA AATCTTGGCC AGTTCGTTCA GCAGAAAAAA 
GAGGAGCGTG AAGAGATCAG GCAGAAGATT GCAGCATTAA GCCGTAAAAG GGATGACTAC 
ATCCAGAAGA AAGAACATGA ATCGGCAGGG GAGCAGACAC TTGGTTCCGC TATTCTCAAG 
ACACTCCATA CTCAAGCAGA AGCGAAAAAC TTCAGGTTCG AGTAG

Protein sequence

MNMKKRFFPL TVAAFAAIGS SLLPATFLNA GSSPPGNTGQ EESLTQKAME EYGRHYANLM 
LVEQHRPYDE KLVQIALLLD TSNSMDGLIN QAKSQLWRIV NELSRAHKRG NDIRLEVALY 
EYGNDRLAMT AGYIRQVTPF TEDLDWLSEA LFSLQTNGGS EYCGHVIGSS LNQLGWNRSG 
DGLKMIFIAG NEPFNQGSVN YEVSCRWAVE REIVVNTIYC GPYQRGIDTL WQQGANKGGG 
SYFAIDSDKV LKGIVTPYDD DLLKLNSAIN STYIPYGSKG EQNLSRQAEQ DMNASKLSPS 
ISAARAASKG SKLYKASDWD LVDALEEKKI SIENISRDAL PKELQEMRPE NLGQFVQQKK 
EEREEIRQKI AALSRKRDDY IQKKEHESAG EQTLGSAILK TLHTQAEAKN FRFE