Gene Rpal_4009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4009
Symbol
ID	6411691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4295934
End bp	4297448
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	66%
IMG OID	642713891
Product	protein of unknown function DUF112 transmembrane
Protein accession	YP_001992980
Protein GI	192292375
COG category	[S] Function unknown
COG ID	[COG3333] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCTGT TCTCCAATCT CGCGCTCGGC TTCCAGGTCG CCGCTTCGCC GACAAACCTG 
CTGCTGTGCC TCACCGGCGC GCTCGTCGGC ACCCTGATCG GCGTACTGCC GGGCATCGGC 
ACCATCGCCA CCGTGGCGAT GCTGCTGCCG ATCACTTTTG GCCTGCCGCC GGTCGGTGCG 
CTGATCATGC TCGCCGGCAT CTATTACGGC GCCCAATACG GCGGTTCGAC CACCTCGATC 
CTGGTCAACA TTCCGGGCGA GGCGACCTCG GTGGTGACCA CGCTCGACGG CTTTCAGATG 
GCCAAGCAGG GCCGCGCCGG CCCGGCGCTG GCGATCGCCG CGATCGGCTC GTTCGCCGCC 
GGCTGCTTCG CCACCGTGCT GATCGCGCTG GTCGGCGAGC CCTTGACCCG GCTGGCGCTG 
GAGTTCGGTC CGGCCGAGTA CTTCTCGCTG ATGGTGCTGG GTCTGGTGTT CGCCGTGGTG 
CTGGCGCGCG GGTCGGTGCT GAAGGCGGTG GCGATGATCG TGCTCGGGCT GCTGCTGTCG 
ACCGTCGGCT CCGACATCGA AACCGGCGTC TCGCGCATGA CCTTCGATGT CCCGGAACTG 
GCGGACGGGC TCGGCTTCGC CACGGTGGCG ATGGGCGTGT TCGGTTTCGC CGAGATCATC 
CGCAACCTGG ATTTCGGCGC CGCGACCGAC CGCGAGCTGG TGCAACAGAA GATCACCGGC 
TTGATGCCGA CCCGGAAGGA TCTGCGCGAC GCGGCGCCGG CGATCGGCCG CGGCACCATC 
CTCGGCTCCC TCCTCGGTAT CCTGCCCGGC GGCGGGGCGG TGATCGCCTC GTTCGCGGCC 
TACACGCTGG AGAAGAAGAT CGCGCGCGAC CCGAAACGGT TTGGCCGCGG CGCGATCGAA 
GGCGTCGCGG CGCCGGAAAG CGCCAATAAC GCCGCCGCCC AGACCTCGTT CATCCCGCTG 
CTGACGCTCG GGATCCCGCC GAACGCCGTG ATGGCCCTGA TGGTCGGCGC GATGACCATT 
CACAACATTG TACCGGGGCC GCAGGTGATG AAGAACCAGC CTGAACTGGT CTGGGGCATG 
ATCGCCTCGA TGTGGATCGG CAACCTGATG CTGCTGGTGA TCAATTTGCC GCTTGTGGGT 
ATTTGGGTAC GATTATTGCG TGTTCCGTAC CGCTTGATGT TTCCGTCGAT CGTGGTGTTC 
TGCTGTATCG GGATCTACTC GGTGAACAAC GCGCCGGTGG ACGTGGTCCT GGCCGGCGCG 
TTCGGGCTGA TCGGTTACTG GCTGGTGAAG CACGATTTCG AGCCGGCGCC GCTATTGCTC 
GGCATGGTGC TGGGGCCGCT GATGGAGGAC AATTTGCGGC GTGCACTGCT GATTTCGCGT 
GGTGATGCCT CGGTATTCAT CACCCGGCCG CTGTCGGCCT CGCTGCTGGT CATCGCTGCC 
GGCCTGCTGA TCCTGTCGGT ATTACCGATG CTGCGGCGCA AGCGTGACGA AGTGTTCGTC 
GAGTCCGAGG GGTAA

Protein sequence

MDLFSNLALG FQVAASPTNL LLCLTGALVG TLIGVLPGIG TIATVAMLLP ITFGLPPVGA 
LIMLAGIYYG AQYGGSTTSI LVNIPGEATS VVTTLDGFQM AKQGRAGPAL AIAAIGSFAA 
GCFATVLIAL VGEPLTRLAL EFGPAEYFSL MVLGLVFAVV LARGSVLKAV AMIVLGLLLS 
TVGSDIETGV SRMTFDVPEL ADGLGFATVA MGVFGFAEII RNLDFGAATD RELVQQKITG 
LMPTRKDLRD AAPAIGRGTI LGSLLGILPG GGAVIASFAA YTLEKKIARD PKRFGRGAIE 
GVAAPESANN AAAQTSFIPL LTLGIPPNAV MALMVGAMTI HNIVPGPQVM KNQPELVWGM 
IASMWIGNLM LLVINLPLVG IWVRLLRVPY RLMFPSIVVF CCIGIYSVNN APVDVVLAGA 
FGLIGYWLVK HDFEPAPLLL GMVLGPLMED NLRRALLISR GDASVFITRP LSASLLVIAA 
GLLILSVLPM LRRKRDEVFV ESEG