Gene Paes_1854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1854
Symbol
ID	6460180
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	+
Start bp	2026006
End bp	2027235
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	46%
IMG OID	642725838
Product	hypothetical protein
Protein accession	YP_002016513
Protein GI	194334653
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAACA AGCAGAGCCA TGGACTTGAT ATCTACCAGG CAAAGGCCTG GCGTAACGAA 
CACACCAATG CAGGGTTCAC CAAAGTCATA AGGATTGCTG AAAAAGAGAT CGTTCTGGTC 
AGTGTCGAAA CGCAACAAAA CGTCACCATC GATTTCATTG ATGCAGATCT GCTCAATACT 
GCCCTTCTCG AATCCGGATG CATCGGTAAA AAGATGATTC TCCTCTGGGA TCTGGAGCAT 
GTCGTCAACA TGACCTACCG ATACAAAAAA GATGCAGCAA ACCTTATCTA TAACAGCGAC 
AGCTCCTTCA AAGCGATTAT CTTTTTCAAT GTCCGGCCTG AATTCATGAC GACAGTTGAA 
ACTTTTGCGG CAATTGTCCA GAAATCGACG TCCATCCGGA TTGTCGATAC ATTTCAGGAA 
GCCATGTCTG CAATAGATGA AATTCGATCT GGCAACATCG ACAATGAGGC TGATAACGAT 
GAAACGGATG AACTGTTTGA ACAGCGAAAA AAAGAGTTTC TCGCCGTCAC AGGCCGGCTG 
AGCTGGCTGA ACATGCTTAA CCAGAATATT AACGTACCCT CACCCGAGGA TCCTGTCTAC 
CCATATTTCA AAGCCATAGA AAACCTGCAA TCAGACCTTT CCGAAAACCT TCATCGCGAA 
CAACTCGAAA TGGAGCAGAT AAAGAACGAT TGCGAGAGAA TACTGACTGA AAAGACCATC 
CAGCTCAACG CGCAGCAGGA ACTCTACAAA CAGTTGAAAC GCCAGCTTGA AAAAGAGAAA 
AACACCCTGG CAGCAAGGAT TGCATCGCAG GAAATGGAAC TCACGCGAGT CTCTACAGCG 
ATTGCAGAAA AAGCCTCGAC GCTCCAGGAA ATGCGCGACC TCATCAGCGG GCTCGATATC 
GATGCCGAGC ACAAGGAAGA GATGATCAGA ACCTGTGAGA GCATGATTGA AACAGAGATG 
ATCGAAAAAA AGCTCAACAT AGAGCTGACC ACAACAGATT CCGAATTTCT GCTGAAACTG 
CAGAAAAAAC ACCCCAATCT CAACCAGAGA GAACTACGCA TCTGCCTGCT GGTCAAACTC 
AATTACGATA CCAAAGAAAT TGCACGTTCG ATTGGCATTT CGACAAGAGG TATGGAAAGT 
ATCCGATACA GAATGCATAA AAAAATAGGA CTTACCCGAC ATCAGTCCAT CAAAGGCTAT 
CTCACGGAAC TTGCAGTAGC CCAAGCCTGA

Protein sequence

MKNKQSHGLD IYQAKAWRNE HTNAGFTKVI RIAEKEIVLV SVETQQNVTI DFIDADLLNT 
ALLESGCIGK KMILLWDLEH VVNMTYRYKK DAANLIYNSD SSFKAIIFFN VRPEFMTTVE 
TFAAIVQKST SIRIVDTFQE AMSAIDEIRS GNIDNEADND ETDELFEQRK KEFLAVTGRL 
SWLNMLNQNI NVPSPEDPVY PYFKAIENLQ SDLSENLHRE QLEMEQIKND CERILTEKTI 
QLNAQQELYK QLKRQLEKEK NTLAARIASQ EMELTRVSTA IAEKASTLQE MRDLISGLDI 
DAEHKEEMIR TCESMIETEM IEKKLNIELT TTDSEFLLKL QKKHPNLNQR ELRICLLVKL 
NYDTKEIARS IGISTRGMES IRYRMHKKIG LTRHQSIKGY LTELAVAQA