Gene Rpal_4466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4466
Symbol
ID	6412150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4801591
End bp	4802682
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	65%
IMG OID	642714348
Product	hypothetical protein
Protein accession	YP_001993437
Protein GI	192292832
COG category	[S] Function unknown
COG ID	[COG0392] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCGAC TGCTGAGCGC GCTGGGGCGT GGCTTCAAGA CGTATATCGG CTGGAAACGT 
GTCGGTATCG TCGCCAGCAT CCTGATTATC GGCTTTGCGA TTTCGTCGCT GATCCGCACC 
CTCAAGGGGG TCGATCACAA CGTCATCCTG ACCGCGCTGA CCGACAAGAG CCCGACCCAG 
ATCGGGATGG CGGCGCTCTG TGTTGTCGGT GCGTTCTGCA CCCTGACGTT CTACGATTTC 
TTTGCGCTAC GCACGATCGG CAAGCTGCAT GTGCCGTACC GCATCGCCGC GATGTCGGCG 
TTCACCTCCT ACGTCATCGG GCACAACCTC GGCGCCACGG TGTTCACCGG CGGCGCGATC 
CGGTTCCGGA TCTATTCGGA CTACGGCCTG TCCGCGATCG ACGTCGCCAA GATCTGCTTC 
ATCTCCGGCC TGACATTCTG GCTCGGCAAT CTGTTCGTGC TCGGCATCGG CATGATCTGG 
CATCCAGCCG CGGCGAGCGC GATGGACCTG CTGCCCGACC AGATCAACCG GCTGATCGGC 
GTCGCCTGTC TGGCCGGTAT CGCCGCCTAT TTCATCTGGC TCGCGACCGG CAAGAAGCGC 
CGCGAGCTCG GCCAGAACGG CTGGAAGGTG GTGCTGCCGT CGGCCAAGCT GACGCTGGTG 
CAGGTGCTGA TCGGCGTGGT CGACCTCGGC TTCTGCGCGC TGGCGATGTA CCTGTTGATG 
CCGTCCGCCC CCTACATCGA CTACGTGTCG CTGGCGGTGG TGTTCATTCT CGCCACCCTG 
CTCGGCTTCG CCAGCCACGC TCCGGGCAGC CTCGGCGTGT TCGACGCCGC GATGCTGGTG 
GCGCTGCCGA TGTTCGCCCG CGAGGACGTC ATCGCCACAC TGTTGATCTA CCGCGTGCTG 
TACTTCCTGC TGCCGTTCGG GATCGCGATC TCGATTATGG GGGTGCGGGA AATCTGGCTG 
AGCGTGATCA AACCGTGGCA GGAACGCCGC GCAGCCTGCA ACGGCAACGA GCACGCGGCG 
ACCGCCGCTC CGGCCGCGGC GCCCGCCCGG GCTCCGGTCG GCCAGGTTGT ACAGCGCTCC 
TCCAAGCTCT GA

Protein sequence

MHRLLSALGR GFKTYIGWKR VGIVASILII GFAISSLIRT LKGVDHNVIL TALTDKSPTQ 
IGMAALCVVG AFCTLTFYDF FALRTIGKLH VPYRIAAMSA FTSYVIGHNL GATVFTGGAI 
RFRIYSDYGL SAIDVAKICF ISGLTFWLGN LFVLGIGMIW HPAAASAMDL LPDQINRLIG 
VACLAGIAAY FIWLATGKKR RELGQNGWKV VLPSAKLTLV QVLIGVVDLG FCALAMYLLM 
PSAPYIDYVS LAVVFILATL LGFASHAPGS LGVFDAAMLV ALPMFAREDV IATLLIYRVL 
YFLLPFGIAI SIMGVREIWL SVIKPWQERR AACNGNEHAA TAAPAAAPAR APVGQVVQRS 
SKL