Gene Paes_2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_2072
Symbol
ID	6459937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	2255121
End bp	2257475
Gene Length	2355 bp
Protein Length	784 aa
Translation table	11
GC content	54%
IMG OID	642726056
Product	hypothetical protein
Protein accession	YP_002016729
Protein GI	194334869
COG category	[S] Function unknown
COG ID	[COG5617] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.404123
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGAACG CACTCCGTCC ATATTTTCTG GTTGCTTTCG TTTTTTGCGC GATGGTTGCC 
ACTCTCCTGT ATCAGGTCCT TTTTCTCGGT ATGGTGCCGT CATCGCCAGA CAGTACCGGA 
CCGATGGCGA CGTCGATGGC GCTCGACGCC CTGCGCGAAT CTTCAGGCAT GTACCCACTG 
TGGCAGCCAT GGTCGTTTTC CGGTATGCCG ACAGTCGAGG CATTTACCTA TCTGAACGGG 
CTCTATTATC CCGGTATCGC GCTCAGCTTG TTTCACATTG ACGGTCTGCT CCTGCAACTC 
CTGCATCTCG TGTTTGCCGC GATGGGGGGG TATGTGCTGC TTCGTTTTTT CAGACTGCGT 
CATATGGCCG CTTTTCTTGG GGGCGCGGCC TTCATGCTCA ATCCCTATCT GGTGACGATG 
TTTGTCTACG GGCACGGCAG TCAGCTGATG AGTGCAGCCT ATATGCCCTG GGTGTTCTGG 
GCCGGCTTGA GGGTTCTCGA TAGTCGAAAA ATCTACGATA TCGCTTTGCT GGCACTTTTT 
GCCGGCTTGC AGCTGCAGCG GGCTCATGTG CAAATTGCCT ATTATACCTG GATGTTTCTG 
TGTCTGCTGA TAGTGATCAA TGTCGTTGTC AGATATACAA CTCTTCGTGA AACCGCCGGG 
AAACTGGCGG CAGTATCTCT GTCGCTTGTG CTTGCATTGG CATTGGCGGC GGCAGTCTAC 
ATGCCTGCCC TGGCCTATAC GCCGTTTTCG GTTCGCGGCG CTTCAGCTGG AGGCGGGGCA 
GCATACGGAT ATGCGACGAT GTGGTCAATG CATCCGACCG AACTGCTGAC CTTTCTGGTT 
CCCGGTTTTT TCGGTTTTGG CGGTATAGCG TACTGGGGAC ACATGCCGTT TACCGATTTT 
CCCAATTATG CCGGTCTGAT TATTCTGCTG CTTGCTCTTG GCGGGGCATG GGCCGGACGC 
CGCGAGCCGT TTGTCTGGTT TCTGGTTTCC TCGATGCTCG TTGCTCTGTT GCTCTCATTC 
GGCAGTTTCT GGAGTCCGTT GTATGACCTG TTCTACCATT TTGCGCCGTT TTTCAGCAGG 
TTTCGGGTGC CTTCGATGGT GCTGATCGTG GTCTCGCTCG ACCTTTCACT GCTTGCGGGT 
TTCGGTTTGC ACGCTCTCGG CAAGGGTCTT GATAAGGGCG CTATCAGGAT CCTTAAAGGC 
GGCTCGTTAG TGCTGGCTCT CTTTATTGTT TTTTTTCTTT TGTTCGAACC TTCCATCGAA 
TCATGGTTCC GCAGCGCCTT TCCTCTTCCC AATGTTGAGG GGGTGCAGCT TGTTCGTCTT 
ATCGAGGATG CCCGTTGGAA TCAGCTGAAA GGAAGCCTGC AGGGCGTTGT CCTCGGTTCT 
GCCTTGTTTT GCGGGCTTCT CTGGCTTTCT ATTCGTCAGG TTTTCTCCGA CCGGGTAACA 
CTGCTTTTCG TGGCGGCGTT AGCGCTTGGT GACATTCTGC TTGTCGATCG TCAGATTGTC 
GATCCGTCAA GGGACTCGTT ACGTTCTTCG CAGCTTCAGG CGGAGGCTGT TCTTGACAAG 
GTGTTCAGTG ATGGCGATGT GGCTGATTTT TTGAAAAACG AACCGGGCAT CTTCAGAATT 
TATCCCGCTG GCGGGCTTTT TGGTGAGAAC CGTTTTGCGG CTGCCGGACT GGAGTCGGTC 
GGAGGGTATC ATCCGGCCAA AATAGCGCGT TATGATGCAC TGCTGAAGCG AACAGCAAAT 
CTTGCCGATA CTGGTGTACT TCGGATGCTC AATGTAGGTT ATGTTATTGC TCCCTCTCCT 
CTTGATCATC CTGAGCTGGA GGGCGTTTAT GAAGGAATGC TTCGTCTTGT GCGGGGCAGG 
CAGGATGTTT GGGTTTACCG CCTCCGCGAC CCTATGCCGA GAGCATGGTT TGCTCTGGGG 
GCAACGGCAT CAGAGTCTGC GGAACAGAGT CTTTCGGGTA TGCTGCAAAG CTCGAGCGGT 
CCGGCTGAGA TGGTGTTTGT CGAGGATGGC GGATGGGAAG GGCAGAGATC GTTCGCCCGC 
GGAGAGGTGC TTGCAATCGA TAGAGGTCCG GAACGGTTAT CGATGAACGT CAGTTCGGAA 
GGAGATGCAC TCCTTGTTGT AAGCGAGGTT TTTTACCCGC AGGGCTGGAA GGCTTCTATG 
GACGGCTCTC CCGTCAGAGT CCACCCTGTC AACGGGGTTA TCCGGGGAGT GCTTGTTCCT 
GAGGGTGAGC ATCACATCGT TTTCAGTTAT GACCGTACGC TTTTTGAAAA CGGGCGACGC 
TATAGCCTTG CGGCAGCCTT GCTGATAGTG ATGCTCTTTG CCGGCGGGAC GCTACTGCGA 
CGCAAGGCAT CGTAA

Protein sequence

MKNALRPYFL VAFVFCAMVA TLLYQVLFLG MVPSSPDSTG PMATSMALDA LRESSGMYPL 
WQPWSFSGMP TVEAFTYLNG LYYPGIALSL FHIDGLLLQL LHLVFAAMGG YVLLRFFRLR 
HMAAFLGGAA FMLNPYLVTM FVYGHGSQLM SAAYMPWVFW AGLRVLDSRK IYDIALLALF 
AGLQLQRAHV QIAYYTWMFL CLLIVINVVV RYTTLRETAG KLAAVSLSLV LALALAAAVY 
MPALAYTPFS VRGASAGGGA AYGYATMWSM HPTELLTFLV PGFFGFGGIA YWGHMPFTDF 
PNYAGLIILL LALGGAWAGR REPFVWFLVS SMLVALLLSF GSFWSPLYDL FYHFAPFFSR 
FRVPSMVLIV VSLDLSLLAG FGLHALGKGL DKGAIRILKG GSLVLALFIV FFLLFEPSIE 
SWFRSAFPLP NVEGVQLVRL IEDARWNQLK GSLQGVVLGS ALFCGLLWLS IRQVFSDRVT 
LLFVAALALG DILLVDRQIV DPSRDSLRSS QLQAEAVLDK VFSDGDVADF LKNEPGIFRI 
YPAGGLFGEN RFAAAGLESV GGYHPAKIAR YDALLKRTAN LADTGVLRML NVGYVIAPSP 
LDHPELEGVY EGMLRLVRGR QDVWVYRLRD PMPRAWFALG ATASESAEQS LSGMLQSSSG 
PAEMVFVEDG GWEGQRSFAR GEVLAIDRGP ERLSMNVSSE GDALLVVSEV FYPQGWKASM 
DGSPVRVHPV NGVIRGVLVP EGEHHIVFSY DRTLFENGRR YSLAAALLIV MLFAGGTLLR 
RKAS