Gene Paes_2012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_2012
Symbol
ID	6459821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	2208851
End bp	2209942
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	48%
IMG OID	642725995
Product	protein of unknown function UPF0118
Protein accession	YP_002016669
Protein GI	194334809
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID	[TIGR01131] ATP synthase subunit 6 (eukaryotes),also subunit A (prokaryotes)

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.578603
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGGG CTGAACTTAA TAATCTTGTT CTGCTGGTCT TTGTTCTGCT TATTTCGGCA 
ATCTTTTTTT CCATGATCTA TGATTTTCTC ATGGTTATTC TGATTGCTGC AATCTTTTCA 
AGTCTTGCGT TGCCTGTCAA CAGGTTTTTT GAGCGTCTGT TCAAGGGGAA AAAGAGCTTG 
AGTTCGGCTT TAGCCCTTGT CTCTATTTCC CTGATCGGCA TTTTTCCGCT CTTTGCCCTG 
ATGGGAATCG TTGCAGCCCA GGCAGTCCGC ATCAGTCGAT CCGCAGGTCC ATGGATCGAA 
AAACGTCTGG AGGAGCCGAC GGCCTTTCAT GATTTGTTTC TTACGCTGCC GTTTTATGAA 
ACGATCAACG CCTACAGCGA TCTCATTCTT CAGAGACTGG GTGAAATGGT CAGTAAAACG 
GGAACCTTTC TTTTCGAAAA CATCTCGTCG TTCACACTGT CGACCGTGCA TACGCTCTTT 
CTTTTTTTTG TTTTCCTCTA TACCATGTTT TTTTTCCTTC GTGACGGCCG CGATATGCTG 
CAGCAGGCGC TCTACTACAT GCCGCTGAAC CAAAGCGATC AGTCGCGCAT GCTCGACAAG 
TTTACCTCTG TGACCCGAGC CACTATTCGC GGTACGTTCG TTATCGGGAT TATCCAGGGA 
ACGCTGGCAG GCCTGGCTTT TCAGGTTGCC GGTATTGAAA GCGCCGTTTT CTGGGGTGCG 
ATCATGACTG TCCTGTCGGT CATACCCGTT GTCGGTTCCG GTCTTGTCTG GGTTCCTGCT 
GTTCTATATC TCTATGCGAC AGGGGAGAAT GTTGCTGCCA CCGGCCTTTT GATTTTCTGC 
GGCATTCTTG TCAGCAGCAT CGATAATATA CTTCGTCCGG TTCTTGTTGG TCGTGATACC 
CGGATGCACG AATTGCTGAT TTTTTTCGGG ACTATCGGCG GTATCGGTTT GTTTGGCATA 
GCAGGTTTTA TCGTCGGTCC GATCATCGCC GCGTTGTTTA TTACCGTCTG GGAGATTTAT 
GGCGAAACTT TCAAGGAGTA TCTCAACGAC GCCAAACAGG CGGGAGATTC TGCTGATGAA 
GAGTCGTTAT AG

Protein sequence

MKRAELNNLV LLVFVLLISA IFFSMIYDFL MVILIAAIFS SLALPVNRFF ERLFKGKKSL 
SSALALVSIS LIGIFPLFAL MGIVAAQAVR ISRSAGPWIE KRLEEPTAFH DLFLTLPFYE 
TINAYSDLIL QRLGEMVSKT GTFLFENISS FTLSTVHTLF LFFVFLYTMF FFLRDGRDML 
QQALYYMPLN QSDQSRMLDK FTSVTRATIR GTFVIGIIQG TLAGLAFQVA GIESAVFWGA 
IMTVLSVIPV VGSGLVWVPA VLYLYATGEN VAATGLLIFC GILVSSIDNI LRPVLVGRDT 
RMHELLIFFG TIGGIGLFGI AGFIVGPIIA ALFITVWEIY GETFKEYLND AKQAGDSADE 
ESL