Gene Rcas_0200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0200
Symbol
ID	5537661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	243637
End bp	244752
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	62%
IMG OID	640892363
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001430351
Protein GI	156740222
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGCAT CGATCACCGG GTTGCTGCGC CCCGACATTG CGGCGCTCGA ACCATACACG 
CCGATTGTTC CGCTTGAAAC GCTCGCCGAG CGACTCGGTC TGCCGGTCGA ACGCATCATC 
AAACTCGACG CCAACGAAAA CCCCTACGGT CCATCACCGC GCGCGCTGGC GGCGCTTGCC 
GCCGTCGAAC ACGATGCCCC TCATCGCTAC GCCATCTACC CCGACCCGGA TCATACCCGC 
CTGCGCGCCG CCCTCAGCCG GTACGTCGGT CAACCGCCAG AACGTATTAT CTGCGGCGCG 
GGGTCCGATG AACTGATCGA CCTGATCATG CGTGCCGTCC TGCGTCCTGG CGATGTCATG 
GTCGATTGCC CGCCGACCTT TGCCATGTAC AGTTTCGATG CGGCGCTCTA CGGCGCGCGT 
ATCGTTGCGG TTCCGCGCAC CGAACAGTTC GATGTCGATG TCGAGGGAGT TGCGGAAGCG 
GTCGAGCGTG ATGGCGCAAA ACTGCTGTTC CTGGCGGCGC CGAACAACCC GACTGGAACG 
CCGCTGGCGC GCACTACGGT CGAGCGTTTG CTCGATCTGC CGATCATCCT GGCGATTGAT 
GAAGCCTATG CCGAATTTGC CGGGACGAGC GTTATCGATC TGGTTGGCAC GCGCCCCAAT 
CTGGTCGTCC TGCGCACCTT CAGCAAATGG GCGGGGCTTG CGGGGCTGCG CATCGGTTAT 
GCGGCAATGC ACGAAGACGT GATTACGTAC CTGTGGAAGA TTAAGCAACC GTACAATGTC 
AATGTCGCCG CCGAAGTCGC CGCAGTTGCG TCACTCGACG ATCTGGACGA GCGGCTGTCC 
ACTGTCGCGC GTATTGTCGC CGAGCGCGAA CGCCTGGCGG CTGCGTTGGC GGCGCTGCCT 
GGCATTCACG TCTACCCCAG TGCGGCGAAC TTCCTGCTCT GTCGGATGAC CAGTGGTGGC 
GCTGCGCGCG CCCGCGCCAT CCGCGACACC CTGGCGCAGC GTGGGATTCT GATCCGCTAC 
TTCAACCGAC CAGGGATCGA CGATTGCATT CGTATCAGCG TCGGACGCCC GGAGCAAAAC 
GACGCCCTAT TGGATGTGCT AAAGGAAGTA GCATAG

Protein sequence

MPASITGLLR PDIAALEPYT PIVPLETLAE RLGLPVERII KLDANENPYG PSPRALAALA 
AVEHDAPHRY AIYPDPDHTR LRAALSRYVG QPPERIICGA GSDELIDLIM RAVLRPGDVM 
VDCPPTFAMY SFDAALYGAR IVAVPRTEQF DVDVEGVAEA VERDGAKLLF LAAPNNPTGT 
PLARTTVERL LDLPIILAID EAYAEFAGTS VIDLVGTRPN LVVLRTFSKW AGLAGLRIGY 
AAMHEDVITY LWKIKQPYNV NVAAEVAAVA SLDDLDERLS TVARIVAERE RLAAALAALP 
GIHVYPSAAN FLLCRMTSGG AARARAIRDT LAQRGILIRY FNRPGIDDCI RISVGRPEQN 
DALLDVLKEV A