Gene Arth_1393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1393
Symbol
ID	4446099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1552037
End bp	1553656
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	67%
IMG OID	639689204
Product	hypothetical protein
Protein accession	YP_830887
Protein GI	116669954
COG category	[S] Function unknown
COG ID	[COG3333] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0764737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGTCT TCTCCTCCCT CATGGACGGG TTCGCCACGG CGCTAACCCC CATGAATTTC 
CTCTATGCAG TCATCGGTGT GGTCCTCGGC ACGGCCGTGG GAGTCCTCCC GGGCCTCGGC 
CCGGCAATGA CCGTGGCCCT GCTGCTTCCG GTCACCTACG CCCTGGAGCC GACCAGCGCC 
TTCATCATGT TCGCCGGCAT CTACTACGGC GGCATGTATG GCGGCTCCAC CACCTCCATC 
CTGCTCAACA CACCCGGTGA GTCGTCATCG GTGGTCACCG CCATCGAAGG CAACAAAATG 
GCGAAAGCCG GGCGGGCGGC ACAGGCTTTG GCCACCGCCG CCATCGGTTC CTTTGTTGCC 
GGCACCATCG GTACCACGCT GCTCGCCGTC TGCGCGCCGA TCGTGGTCCA GTTCGCCGTC 
AGCCTGGGCT CCCCCAGCTA CTTCGCGATC ATGGTGCTCG CCCTGCTGGC CGTCACCGCC 
GTGCTGGGTT CCTCCCGGCT GCGCGGGTTC GCGTCGCTGG GCCTGGGCCT GGCTATTGGC 
CTCGTGGGCA TGGATTCAGT CACTGGCCAG CAGCGCCTCA CGTTCGGGAT GCCGCTCCTG 
GCCGACGGCC TGGACATCGT GGTGGTGGCT GTGGCCATCT TCGCCGTCGG CGAGGCACTG 
TGGGTGGCTG CGCACCTGCG ACGCACTCCG ATGAACATCA TCCCTGTAGG ACAGCCCTGG 
ATGGGCAAAC AGGACTGGAA GCGGTCCTGG AAGCCCTGGC TCCGCGGTAC GGCTTTTGGG 
TTCCCCTTCG GAGCACTTCC CGCGGGCGGC GCCGAGATCC CCACTTTCCT GTCCTACGTG 
ACGGAGAAGC GGCTCTCCAA GCATCCCGAG GAATTCGGCC ACGGCGCCAT CGAGGGTGTT 
GCCGGGCCGG AAGCCGCCAA CAACGCCGCG GCGGCAGGCA CGCTGACCCC CATGCTTGCC 
CTTGGCCTGC CCACCAACGC CACGGCCGCC GTCATGCTGG CAGCTTTCAC GTCCTACGGC 
ATCCAGCCCG GGCCGCAGCT GTTCGCCAGC GAGGGGCCGC TGGTCTGGGC GCTGATTGCC 
AGCCTCTTCA TCGGCAACTT CCTGCTCCTG ATCATCAACC TTCCGCTGGC ACCGGTCTGG 
GCAAAGCTCC TGCAGCTCCC TAGGCCGTAC CTCTACGCCG GGATCCTGTT CTTCGCTACG 
CTGGGCGCCT ATTCGGTGAA CCTGCAGGCA TTCGACCTGG TCCTGTTGCT GGTGCTTGGT 
GCGTTGGGCT TCATGATGAG GCGCTTCGGG CTCCCCGTCC TGCCGCTGGT CCTGGGTGTG 
ATCCTGGGGC CGCGCCTGGA AGGCCAGCTG CGCAAGACCC TCCAGCTCAG CGCCGGCAAT 
CCGGCCGGGC TGTGGAGCGA ACCGATCGCC GTCGGGATCT GGGTCATCGT GGCGATCATC 
CTTCTCTGGC CGCTGCTGTT CATGCTGATC CGCCGCAACC GCCCGATGCG CAGCCCACTG 
CTTCCCGCCA CTTCCGGCGC AGCCGAACCG CGGGAAGTTA GCGGCAGCGT CAGCCACGCC 
AGCCGCCGTG CGGACAGTTC GTCCGGCGAC GGCCACAGCG ACGGCGACGG CGACGGTTAG

Protein sequence

MDVFSSLMDG FATALTPMNF LYAVIGVVLG TAVGVLPGLG PAMTVALLLP VTYALEPTSA 
FIMFAGIYYG GMYGGSTTSI LLNTPGESSS VVTAIEGNKM AKAGRAAQAL ATAAIGSFVA 
GTIGTTLLAV CAPIVVQFAV SLGSPSYFAI MVLALLAVTA VLGSSRLRGF ASLGLGLAIG 
LVGMDSVTGQ QRLTFGMPLL ADGLDIVVVA VAIFAVGEAL WVAAHLRRTP MNIIPVGQPW 
MGKQDWKRSW KPWLRGTAFG FPFGALPAGG AEIPTFLSYV TEKRLSKHPE EFGHGAIEGV 
AGPEAANNAA AAGTLTPMLA LGLPTNATAA VMLAAFTSYG IQPGPQLFAS EGPLVWALIA 
SLFIGNFLLL IINLPLAPVW AKLLQLPRPY LYAGILFFAT LGAYSVNLQA FDLVLLLVLG 
ALGFMMRRFG LPVLPLVLGV ILGPRLEGQL RKTLQLSAGN PAGLWSEPIA VGIWVIVAII 
LLWPLLFMLI RRNRPMRSPL LPATSGAAEP REVSGSVSHA SRRADSSSGD GHSDGDGDG