Gene Arth_1837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1837
Symbol
ID	4445631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2061732
End bp	2063168
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	64%
IMG OID	639689655
Product	3-beta hydroxysteroid dehydrogenase/isomerase
Protein accession	YP_831327
Protein GI	116670394
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGCATAA CCAAACCACA CACCACGGTG CTTCTCACCG GGGCAACCGG CAACTGGGGG 
AGGGCGACCC TGCGCGAGCT CTCCTCGCGT TCGGACCGCG TCACCGTACT GGTGCTCTCC 
TTACCAGGCG AAAAAGACAA GGCCGTACTG TCGGAGTTCT CGGCCATGGA GAACCTGGAT 
GTTGTCTGGG GGGATCTGAC AGATTACGCC ACTGTTGCGA CGTGCGTAGC GCGGGCGGAT 
GTGGTGCTCC ATGTGGGGGC GGTTGTTTCG CCTTTGGCCG ATGAGCAGCC TGAGCTGGCT 
ACTCGTGTGA ACGTGGGCAG CATGCGGAAC ATCATCCGGG CGGTGAAGGC ACAGCCCGAT 
CCCAGCCGGA TCAGGGTTGT CGGCGTCGGG TCGGTAGCGC AGACCGGGAA CCGCAACCCC 
CCGCTCCATT GGGGCAGGGT CGGTGACCCA ATCCGCGTGT CCCGGTTCGA CGCCTATGGC 
CAAAGTAAGG TGACAGCCGA GCGGGAACTT GTCGAGGCCG GCCTGCCGAC TTGGGTCTGG 
CTGCGGCAGA CAGGAATCTT CCATCCCGGG ATGCTCGAAA TACGGGACCC CATCATGACC 
CACTCGCCGT TCGCAGGAGT CATGGAATGG GTTTCGGCAC AAGACTCGGC CCGGCTGCTG 
GCCAACCTCT GCGAACCGGA TGTCCCGGGC GAATTGTGGG GAGGTGTCTA CAACATCGGC 
GGGGGCGAGG GCTGGCGGCT CAGCAACTGG CAACTGCAGA CGGCCATCGG CCAAGCTGTG 
GGCGTGAAGG ACATCAGGAA GTGGTACGAC CGGAATTGGT TCGCGCTGAA GAACTTCCAT 
GGACAGTGGT ACACCGACAG CGACCGGCTG CACGCCCTGG TCCCGTTCCG CCAGGACACG 
TTCGAAAGTG CCCTCGCCCG CGCCCTCGCC ACGGCCCCCT CGTCAGTACG AAATGCCGGC 
AAGGTCCCGG CCTGGATCGT CAAACACCTC GTCATGAAGC CGCTGTCCCG CAAACCCCGG 
GGAACGATGG CAGCCATCAG GTCAGGAACC GACCAGGAGG TCAGCGCCCA TTTCGGCAGC 
CTGCCGGAAT GGCGCAGCAT CGGCGACTGG TCCACGTTCG AGCCGCCCGC ACCCTCACGC 
ACCCCGTCCT ATCTCGACCA CGGATATGAC GAGAACAAGC CTGCATCCGA GTGGTCCGCC 
ATCGATTACC TGGAGGCAGC AGCCTTCCGA GGCGGCAGGC TTTTGACCGA AGACGTGAAC 
CCTGGGCTTC CGTCGGCACC GCTCATGTGG TCCTGTGGGG CGGGCCATGA ATTCGCTGCC 
AGCCCAAGGC TGGTGCTTCA GGCTGGCCAC TGGTGCCCCG CATGTACCGC CGATCCCGCA 
GGCTACGACC GGCAAGCCGA GCACAACAAA TTCCTCGCTC AGGTCATCGA TGCATGA

Protein sequence

MSITKPHTTV LLTGATGNWG RATLRELSSR SDRVTVLVLS LPGEKDKAVL SEFSAMENLD 
VVWGDLTDYA TVATCVARAD VVLHVGAVVS PLADEQPELA TRVNVGSMRN IIRAVKAQPD 
PSRIRVVGVG SVAQTGNRNP PLHWGRVGDP IRVSRFDAYG QSKVTAEREL VEAGLPTWVW 
LRQTGIFHPG MLEIRDPIMT HSPFAGVMEW VSAQDSARLL ANLCEPDVPG ELWGGVYNIG 
GGEGWRLSNW QLQTAIGQAV GVKDIRKWYD RNWFALKNFH GQWYTDSDRL HALVPFRQDT 
FESALARALA TAPSSVRNAG KVPAWIVKHL VMKPLSRKPR GTMAAIRSGT DQEVSAHFGS 
LPEWRSIGDW STFEPPAPSR TPSYLDHGYD ENKPASEWSA IDYLEAAAFR GGRLLTEDVN 
PGLPSAPLMW SCGAGHEFAA SPRLVLQAGH WCPACTADPA GYDRQAEHNK FLAQVIDA