Gene Rpal_0471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0471
Symbol
ID	6408119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	507323
End bp	508465
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	62%
IMG OID	642710383
Product	NMT1/THI5 like domain protein
Protein accession	YP_001989507
Protein GI	192288902
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.886983
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCCCG CTTTCCTGCT GCGAGCGTTA ACCGGGGTGC TGTTGGCGGT GGGGGTGGCG 
CTGGCTTCCC CCGTTCATGC CTCCGGCCAC GGCCATGGCG CTGAAAAGCC CGCCGAAAAG 
CCGCCGGAAC CGCCGCCCCC GCCCCGACCG AAGAAGCCGC CGCCGCCGAA GGTGCAACCG 
GTGCGCAAAG TGCCCGAAGG GGGCTTCGAC AAGGTGTCGT TCGGCACCAA TTGGGTGGCC 
GAAGGTGAGC ATGGCGGGTT CTTCCAGGCG GTCGCGGACG GCACCTACAA GACCTACGGC 
CTCGACGTCA GCATCGTGCC GGGCGGCCCG AACGTGAACA ATCGCGCGCT GCTGATCGCC 
GGCAAGCTCG ACTTCTTCAT GACCGCCAAC ACGCTGCAGT CGTTCGACGC GGTGGCCAAC 
AACGTGCCGG TGGTGGCGAT TGCCGCGATG TTCCAGAAAG ACCCGCAGGT GTTCGTCTCG 
CACCCGGAGT CGAAGATCGA GACGCTGAAC GATCTGAAGC CACTGACGCT GTTCGTCTCT 
AAGGAGGGCA TCACCAGCTA CTTCCAGTGG CTGAAGTCGG AATACGGCTT CAGCGAAGCC 
AAGGTGAAGC CCTACACCTT CAACCCGCAG CCGTTCATTA TCGATCGCCG CAGCGCGATG 
CAGGGCTACG TCACCTCGGA GCCGTTCACT GTCGAACAAG CCGCCAAGTT CAAGCCGAGC 
GTGCTGCTGC TGGCCGACTA CGGGCTGAAC GGCTACTCGA CCCTGATCGA GACCCGGCGT 
GATCTGATCG ACAAGAACCC TGACATGATC CAGCGCTTCG TCGACGCGTC GATCATCGGC 
TGGTACAATT ATCTGTATGG CGATAATTCC GCCGGCAACG CGATGATCAA GCAGCTCAAT 
CCGGAAATGA CCGACGAGAT GCTCGCCTAT TCGGTCGAGA AGATGAAGCA ATACGGCATC 
GTCGATTCCG GAGACGCCAT CAAGAACGGC ATCGGCGCGA TGAACGACGA ACGCTACGCC 
TCGTTCTTCG ACAAAATGGC GCGTGCCGGG GTGGTGACGC GCGGCCTCGA TTTCCGCAAA 
GCCTATACGC TGCAGTTCAT CAACAAGGGC GTTGGCGTCG ACCTGCGTCC GAAGCAGAAA 
TAG

Protein sequence

MSPAFLLRAL TGVLLAVGVA LASPVHASGH GHGAEKPAEK PPEPPPPPRP KKPPPPKVQP 
VRKVPEGGFD KVSFGTNWVA EGEHGGFFQA VADGTYKTYG LDVSIVPGGP NVNNRALLIA 
GKLDFFMTAN TLQSFDAVAN NVPVVAIAAM FQKDPQVFVS HPESKIETLN DLKPLTLFVS 
KEGITSYFQW LKSEYGFSEA KVKPYTFNPQ PFIIDRRSAM QGYVTSEPFT VEQAAKFKPS 
VLLLADYGLN GYSTLIETRR DLIDKNPDMI QRFVDASIIG WYNYLYGDNS AGNAMIKQLN 
PEMTDEMLAY SVEKMKQYGI VDSGDAIKNG IGAMNDERYA SFFDKMARAG VVTRGLDFRK 
AYTLQFINKG VGVDLRPKQK