Gene Arth_1238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1238
Symbol
ID	4446267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1361427
End bp	1362956
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	67%
IMG OID	639689046
Product	hypothetical protein
Protein accession	YP_830732
Protein GI	116669799
COG category	[S] Function unknown
COG ID	[COG2327] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.235902
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGTTCG TGGTGCAGGG CGATCTCGGC CAGGGTGCAT ACCACATTGG CGATGAGGCC 
ATGACACTGG CGGCAGTGGA TGAACTTTCC CGGCGCACCG GGGCCTCCTT TGTGCTGATG 
TCCCGAGATC CGGAACAGAC CACGGAGCTT TACGGCACAG GGTCCATGGC CACCATCGAA 
TTCCCGTGGC CGCCCGCCGA GCGGAGTGCT TACCTGGAAC TCGTACGCCG GGCCGCCAAG 
GGAGACCGGA CTGCCCTCCC CGCTACCGAC CACGTGTGGG CCGTCATCGA GGAGATCTCG 
ACGGCGGACG GCGTCCTGAT TGCCGGCGGC GGCAACATGA ATTCCCTCTA CGGCTGGCTG 
TTGTACGAGC GTGCCGCCGT CGGCATCATT GCCAGGGAAC TCGGCAAGCC GCTGGTGGTC 
AGCGGACAGA CGTTCGGGCC TACGCTGCTG CCGCAGGACC GGAAAATACT TCACGAACTC 
CTCGACAGCG CCGCACTCGT CGGCGCCCGC GAACCCGTAT CCTACGCCCT GGGATTCGAA 
TTGGGCCTCG GCTCGGACAA GCTGGTCCGC GTCCTGGATG ACGGCAGCTT CCTGCGCTCG 
CAGACGGACC CGGCACCGGC GGGCGCAGAC GGCGGCCTGC CGGAGCTGCC GGCCGACGGT 
TACATCGCGG CCACCGTGGG CCCGGACGCA TGGCGCGAAG GAACGCGCAC CCTCGCCCCG 
TTCGCAGCCG TGCTGGACCG CGCGGCAGAG GTCACCGGCC TCCCGGTGTA TCTGCTGCCC 
CACATGGGCA CGCTTGGATC CTCGGACAGC GGGGGCGACC ACGACTCCCA CCGGACCGTG 
CTGGCGCACT CGCGGTCGGG AAAGCTGAAG ATGCTGCCCG TGCTGCCGGT GCGCACGGCG 
GTGGCCGTCA CCGCCGGCGC CCGCCTGGTG GTCACCAACC GTTACCACCC TGCCGTTTTC 
GGGCTGGCTG CAGGTGTACC CGTCGTCTCC CTGGCCAATG ATGCCTACTC GGACATCCGT 
CTTTCCGGTG CACTAGGAAA CTGGGGTCTG GGCGATTGGG CACTGCCGCA GCCAAGCCTT 
TCCCCCGGCG GTGTGGAGGA GGCCGTTGCG GAGGCCTGGC GGCGGCGAGA CGAGATCGGG 
CAGCACCTTG CACGGCTGCG GCCCGGATTC GAGCGTTCCC AGGCGACATG GTGGGATGCC 
GTGGCCGAGG TCCTGCGCGG CGTCGGAACC GACGACGAAC CTGGCACCCG CTACCGGGGA 
CTTGACGAGG CGCCGCCGCT AAGCGCGGCG GAAACCTGGT CCCGCCAGGC TACGGAGCAG 
CGGGCGCTGT TCCGCACCTT GAGCCTGGAA ATCGGACGGC AGTGGACGGC ATGGGACGAT 
GTGCGGTCCC AACGCGATGT GCTGATCCAT GAACGGGATG AAGCACTACG GGAAAAGGAC 
AGGATCCTGC AGTCACGAAC TTTCAAAGCA GCAAGAATAT TCGGCCGCGG CGCGGACTTT 
GCGCGCCAGC TGACCGGAAG GAAACACTGA

Protein sequence

MKFVVQGDLG QGAYHIGDEA MTLAAVDELS RRTGASFVLM SRDPEQTTEL YGTGSMATIE 
FPWPPAERSA YLELVRRAAK GDRTALPATD HVWAVIEEIS TADGVLIAGG GNMNSLYGWL 
LYERAAVGII ARELGKPLVV SGQTFGPTLL PQDRKILHEL LDSAALVGAR EPVSYALGFE 
LGLGSDKLVR VLDDGSFLRS QTDPAPAGAD GGLPELPADG YIAATVGPDA WREGTRTLAP 
FAAVLDRAAE VTGLPVYLLP HMGTLGSSDS GGDHDSHRTV LAHSRSGKLK MLPVLPVRTA 
VAVTAGARLV VTNRYHPAVF GLAAGVPVVS LANDAYSDIR LSGALGNWGL GDWALPQPSL 
SPGGVEEAVA EAWRRRDEIG QHLARLRPGF ERSQATWWDA VAEVLRGVGT DDEPGTRYRG 
LDEAPPLSAA ETWSRQATEQ RALFRTLSLE IGRQWTAWDD VRSQRDVLIH ERDEALREKD 
RILQSRTFKA ARIFGRGADF ARQLTGRKH