Gene Rcas_3969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3969
Symbol
ID	5541475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5175011
End bp	5176030
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	59%
IMG OID	640896077
Product	hexapaptide repeat-containing transferase
Protein accession	YP_001434020
Protein GI	156743891
COG category	[R] General function prediction only
COG ID	[COG0110] Acetyltransferase (isoleucine patch superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.520917
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0660336
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCGC AGTCTTCCTC AGCGCATGGA AGCATTCTTA TCCCTATGCA CACGCTGTTT 
GTCGTGTTAA TCCTGCTAGC GCCGCCGCCG CTTAAGCCCT GGTTGATGCG GACGCTGCTC 
GGCGCGCGTG TCGGACGGAA TGTGCGCGTC GGTTGGTTCG CTGGCATATC GGCGCGCCAC 
ATTGCCATTG GTGACGAAAG TGATATTCGG GCGTTGACCT TCATCAGTTG CCACGGCGAT 
GTGATCATCG GTCGCTACTC GATTATCAGC AGTTTCGTCC TGGTGTATGG CGCCGCAGAC 
CTGATCATTG GCGACCATGC GTATATTGGT CCGCAAACGT TCATCAATTG TGATGAATGT 
GTTCGCATTG GCAACTATTC CGCACTCGGC GCGCGCTGCA TGGTCTACAC GCACGGGTCA 
TTCTTCCCGT ACACCGAGGG CTACTGGGTG AAGTTCGGAC CGGTCACGAT CGGCGACTAT 
GTCTGGTGCG CGGCCGGTGT CTTCATTCAT CCAGGAGTGA CAATCGGCGA CCATGTGTTT 
ATCAATTCGC GTTCGGTCAT TACCCGCGAT GTTGCCTCCG GCGATGTGGT CGAGGGCTTT 
CCGGCGCAAA CGGTCACGAC CATGAACCGC CTGAAACGCA GCATGTCGCC GCGCCGCCGT 
GATGCGGCTG CGCGTCGGAT TCTCGATCAC TTCGTCGATC TCGGCGTGCG GCGTGAACTG 
CGCCTCGCCG TCGAGCAGCG CGATGGGCAG GTCGCCTTTC GGTATCGTGG GAGGAAGTAC 
CGACTGCTGT GCATCCCTTC AGACGGCGCC CCGCCATCGT TCGATAACGG ACCCGCATGT 
CACATCGTTG CACTGGTGAC TCGTCCTGAT TGGACGCCGC CAACCGGCGC GCCGATCTAT 
CCGCTCGACC TGATTGCCTA CCGCACTCCG CGCAGCAACG ATCCCGTCCA TCATGCGTTG 
CGCACCTTCC TGATGCGCTA CTACGGCGTG CAGGTCGAAT ACAGCGATGC CGCGAAGTAA

Protein sequence

MIAQSSSAHG SILIPMHTLF VVLILLAPPP LKPWLMRTLL GARVGRNVRV GWFAGISARH 
IAIGDESDIR ALTFISCHGD VIIGRYSIIS SFVLVYGAAD LIIGDHAYIG PQTFINCDEC 
VRIGNYSALG ARCMVYTHGS FFPYTEGYWV KFGPVTIGDY VWCAAGVFIH PGVTIGDHVF 
INSRSVITRD VASGDVVEGF PAQTVTTMNR LKRSMSPRRR DAAARRILDH FVDLGVRREL 
RLAVEQRDGQ VAFRYRGRKY RLLCIPSDGA PPSFDNGPAC HIVALVTRPD WTPPTGAPIY 
PLDLIAYRTP RSNDPVHHAL RTFLMRYYGV QVEYSDAAK