Gene Rcas_2018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2018
Symbol
ID	5539496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2587963
End bp	2589057
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	58%
IMG OID	640894153
Product	PilT domain-containing protein
Protein accession	YP_001432124
Protein GI	156741995
COG category	[R] General function prediction only
COG ID	[COG4956] Integral membrane protein (PIN domain superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.625918
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAATCA GTCTTAATTT TATCGTTCGC CTGATCGGGA TGTTCGCGCT GGGGTATGCA 
GGTTTTCGCA TTGGCATCAC GCTATCGGGT GAACCTCCAA CCGAGATTGA GGTCCTGGCG 
ACCCAGTTGC TGGCGCTGGC AGGCGCCGGC TTGGGTCTGT TGACCACCCA CCGCTGGACG 
GTCGAGCCGG TTCGTGATCT GATTCGTCAT ATGCGAAGCG TCTCGATTGC CGAATTGACG 
GCGCTGGTAT TCGGGGCGCT GGTTGGGCTG ATTTTTGGCG TGCTCTTGTC TGTTCCACTG 
GCGCAACTGC CGCCGCCGCT CGGTCAGTTT GGTCCAATCG TCGCTGCCGG TGCGCTGGCG 
TATCTTGGTG CGATCCTCTT CTCCAACCGT AAGAAAGATA TTGCGGATAT GCTCCTCGCC 
TCGCGCCGCG GAACCTTCTC CTGGTCGCAA CAGGTCGGCG ATGCTATCCA GCCGCCGCGT 
CGGTATCTGA TTGATACCTC AGCCATTGTT GATGGACGCA TTGCGGCTGT AGCGCAGACG 
GGCTTTGTCG ATGGAACATT GGTCGTGCCC GACTTCGTGT TGCACGAGTT GCAATCGCTG 
GCGGACTCTG CCGATGAACT GCGGCGGATG AAAGGGCGGC GCGGGCTTGA GATTCTGAAC 
ACGATGCAGA AACAAATGAA TAGCGCCGTG GAAGTGCTGA ACGCCGACAT TCCCGGCACT 
ATGGACGTGG ACGAGAAACT CGTCATTCTG GCGCGCCAGT ATCGCTGCCC GATTATTACG 
AATGATAATA ACCTTGGGCG CGTTGCGGAA CTCCAGGGGG TCAGGGTTCT GAGCCTGAAC 
CATCTGGCAG ACGCCGTTCG TCCGCCGGTC ATTCCCGGTC AGGACCTGCG TGTGACAATC 
CGCGATATTG GGCGTGAGCG TGAACAGGGG ATTTCGTTTC TGGAAGATGG CACGATGGTG 
GTGGTCGAAG ACGCGCGGCG TCTGATTGGG CGCGAGGTGG ATACGATTGT CACGCGCGTC 
TATCAGACGC AGACCGGTCG GATCGTGTTT GCACAACTGC GGCTGGAGAA TGTGGTGAAG 
CAGGGACCGG TCTGA

Protein sequence

MRISLNFIVR LIGMFALGYA GFRIGITLSG EPPTEIEVLA TQLLALAGAG LGLLTTHRWT 
VEPVRDLIRH MRSVSIAELT ALVFGALVGL IFGVLLSVPL AQLPPPLGQF GPIVAAGALA 
YLGAILFSNR KKDIADMLLA SRRGTFSWSQ QVGDAIQPPR RYLIDTSAIV DGRIAAVAQT 
GFVDGTLVVP DFVLHELQSL ADSADELRRM KGRRGLEILN TMQKQMNSAV EVLNADIPGT 
MDVDEKLVIL ARQYRCPIIT NDNNLGRVAE LQGVRVLSLN HLADAVRPPV IPGQDLRVTI 
RDIGREREQG ISFLEDGTMV VVEDARRLIG REVDTIVTRV YQTQTGRIVF AQLRLENVVK 
QGPV