Gene Paes_2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_2101
Symbol
ID	6458397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	2281176
End bp	2283197
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	32%
IMG OID	642726083
Product	hypothetical protein
Protein accession	YP_002016756
Protein GI	194334896
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGGGG AAATGATAAG AGAGCCTAAA GGTGAAGTTA TTGTGATATT CGTACACGGA 
TTGCTTGGAG GTGTTGGTGA TTCATGGACA AATTCAAATG GTACATATTG GCCGGAATTG 
CTGGAAAATG AATCCGATTT AGAATCGGTG GGTATATATG TGTTTACATA TCATTCTGAT 
TTTTCTAGTG GAGACTATGG ACTTAGTGAT ATAGTGGATG CATTACGAGA GCAGATGAAG 
ACAGATGATA TTATTAAGAA TAAAAAATTA CTATTTATTT GTCACAGTAT GGGCGGCATA 
GTAGTGAGAA AATATTTGGT TGAAAATGCA AGTAAGCTAA TTGAATGTGA TTGCGAAATT 
GGTTTATACC TTTTGGCATC TCCATCATTA GGTTCTTTAT ATGCTAATTG GTTAGAGCCT 
ATAATAAATA TTTTCAATCA TAGGCAAGCT TCAATGCTTA AATTTATAAG AAGAAATCCA 
CATCTCTCAG ATTTAGATAG AGAATTTATG AATCTTAAAG AATTAAGTGA TTTAAATATT 
GTGGGTAAAG AAATTATTGA AGATAAATTC ATATTTTTTG ATAAATTTTT TAAAAGACAG 
ATTGTTGAGC CATTTTCTGG TGGCAGGTAC TTTGGTGAAC CTTTTAAGGT TCCAATGTCT 
GATCATTTTT CAATAGCACA ACCTGAAAAC AAGCATGCAA TTCAGCACAG ATTGTTATGT 
CAATTTATTT CAGATTTTAC ATTTAATAAA TATTTATTTC CACATTCGAT AAAAAGAATT 
TTTTCGAGGG CGGATAGTCA CGACTTCCAG GAAAACATTG AATCTCTTAT AAGAGGTTGT 
GGTCATTTTG TGCTTATTGG GACAGGTTTG ACAATATTAC AGAAAGACCC TTTTGCTTAT 
GAAGTGTTTG AGAGGGCAAA GAATAATGAA TTTAAAATTG AGATATATCT TGCTGATCCA 
CATAGTCCAG ATGTACAATG TCGTCTTATA GAAGAGGAAT TAGGCACTTT GAAGCCGCCT 
GTTGGAAAGT CGGGTTTGAC TAAAAGACTT GATACGTTAT ATGGGTTATG GAAGGATTTT 
GATTTTAGCG ATAATATTTC TATTAACGTT TTTCGTAATT ATCCAACATT TGCTCTTATT 
ATTATAGATG ATAATTATTT TATATACCCA TACGGGTTTG CTAAGTTGGG TAATTTTAGT 
CCCGTTATGT CTTTTTTGAA AACTGGAAAC ACAGATGATT CTATGATTAG ATTTTTGGAT 
GATCAATATG TTTCAATTAA AAATAGTTCG TGTGATTTAC GCAAGATAAG GTCCAGGGGG 
AATGATGATG CTGAAATAGT GAAAGATTTG TATTCTTTTG CTTTATATAT TGTGCCACCT 
AAAGATAGTG ATTTGTATGT TTTCGGTACA GATGTGCTAG GCTATGATGT AAGAGCTCGA 
CTTAATAAGA AAAGTCAGTG GGAAGATTTT GTGGGGGACG CTTTTGAATA TGGATTTCAT 
CTTACAATAT GCGATGCACT ATATTTTTAT AACGTAAGTG ATGTAAAATT AGCTGTTACA 
GCTATAGAAT ATATATCGAA AGATTTTGTG CCTTTCGAAA TAAACAACTT ACGCATTAGA 
GAAAGTTACC CTAGTCAAAA TTGTTTATCT GTTGTAGGTG ATGATGCAGG AGGTTCATTA 
GAGGCTTTAC ATTTTGAGTT TGTTACAAAT GTCTATCGTC GCGCAGCAGA GTCAAATTAT 
TCCTTAGGGA TGGCAGGGCC ACCTCGGGAT AAAAACATAC ATAGATCAAG ATTAATGATA 
GAAAAATATA AAGCACCGTA TATCATAAAA AAATTCTGCC CTCACTTTAC GCTTTTAAAT 
AAAATAAATA ATTCATCAAT GAAAGCTGTA AGTGAAAAAT TAAATGTTAT TTTTTTAAAT 
TCTGTAAAAG ATACAACATT GAGAGTTGAT TCTTTGGCTT TAATGAAGAA AGATTACTAT 
AAAGGTAAGT GGGTGATAGA AAAAGAAATA AGATTAGGTT GA

Protein sequence

MNGEMIREPK GEVIVIFVHG LLGGVGDSWT NSNGTYWPEL LENESDLESV GIYVFTYHSD 
FSSGDYGLSD IVDALREQMK TDDIIKNKKL LFICHSMGGI VVRKYLVENA SKLIECDCEI 
GLYLLASPSL GSLYANWLEP IINIFNHRQA SMLKFIRRNP HLSDLDREFM NLKELSDLNI 
VGKEIIEDKF IFFDKFFKRQ IVEPFSGGRY FGEPFKVPMS DHFSIAQPEN KHAIQHRLLC 
QFISDFTFNK YLFPHSIKRI FSRADSHDFQ ENIESLIRGC GHFVLIGTGL TILQKDPFAY 
EVFERAKNNE FKIEIYLADP HSPDVQCRLI EEELGTLKPP VGKSGLTKRL DTLYGLWKDF 
DFSDNISINV FRNYPTFALI IIDDNYFIYP YGFAKLGNFS PVMSFLKTGN TDDSMIRFLD 
DQYVSIKNSS CDLRKIRSRG NDDAEIVKDL YSFALYIVPP KDSDLYVFGT DVLGYDVRAR 
LNKKSQWEDF VGDAFEYGFH LTICDALYFY NVSDVKLAVT AIEYISKDFV PFEINNLRIR 
ESYPSQNCLS VVGDDAGGSL EALHFEFVTN VYRRAAESNY SLGMAGPPRD KNIHRSRLMI 
EKYKAPYIIK KFCPHFTLLN KINNSSMKAV SEKLNVIFLN SVKDTTLRVD SLALMKKDYY 
KGKWVIEKEI RLG