Gene Arth_1137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1137
Symbol
ID	4446370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1232662
End bp	1233732
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	63%
IMG OID	639688943
Product	basic membrane lipoprotein
Protein accession	YP_830631
Protein GI	116669698
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGGCG TTGCCACCGC CGGGGCGGCC GCTCTCCTGC TGACCAGCTG CGGGGCTGCC 
CCGGAAGCGG GCAACACCGC TAGCGCCACC GCCAGCGACT ACACGGGCTG CATCGTGTCC 
GACTCGGGTG GATTCGACGA CCAGTCGTTC AACCAGTCCT CCTACGAAGG CCTGAAGAAG 
GCTGAGAAGG ATCTCGGGAT CAAGGTCAAC CAGGTCGAGT CCAAGACCAA CAACGACTTC 
GAGCCGAACC TCCGCGCCAT GGTCACTGCA GGCTGCGACC TGACCGTCAC GGTCGGCTTC 
CTCCTCGGCG ACGCCACCAA GGCCCAGGCC ACCGCCAACC CGGACAAGCA CTTCGCCATC 
ATCGACTTCG GCTACGACAC CCCCATCACC AACGTCAAGC CGATCATCTA CGACACCGCC 
CAGGCTGCCT TCCTGGCCGG TTACCTCGCG GCAGGCTCCA CCAAGACCGG AACGGTGGCG 
ACCTTCGGCG GCATCAAGAT CCCCACTGTC ACCATCTTCA TGGACGGCTA CGCCGACGGC 
GTGAAGTACT ACAACGAACA GAAGGGCAAG GACGTCAAGA TCCTTGGCTG GGACAAGGCG 
AAGCAGGACG GCAGCTTCAC GGGCGACTTC GAAAAGCAGG ACAAGGGCAA GCAGCTGACC 
CAGAACTTCC TGGACCAGGG CGCAGACATC GTGATGCCCG TTGCCGGCCC CGTCGGCAAG 
GGCGCAGGCG CAGCACTCAA GGAAGCCAAG GCCGCAGGCA AGGACGTCAA ACTCATCTGG 
GTTGACTCGG ACGGCTTCCT CACCGCCCCT GACTACAAGG ACATCATGCT CTCCTCCGTC 
ATGAAGCAGA TGGGCGAAGC AGTGGAGACC GTCGTGAAGG AAGACAAGGA CGGCAAGTTT 
AGCAACACGC CGTACGTCGG CACCCTCGCG AACGACGGCG TGCAGCTGGC TCCGTTCCAC 
GATCTGGAGT CCCAGGTTCC CGCGGAACTG AAGACCGAAC TGGAACAGAT CAAGAAGGAC 
ATCGTCGACG GCAAGCTGAA GGTCGAGTCG GCAGCGAGCC CGAAGGCCTA G

Protein sequence

MTGVATAGAA ALLLTSCGAA PEAGNTASAT ASDYTGCIVS DSGGFDDQSF NQSSYEGLKK 
AEKDLGIKVN QVESKTNNDF EPNLRAMVTA GCDLTVTVGF LLGDATKAQA TANPDKHFAI 
IDFGYDTPIT NVKPIIYDTA QAAFLAGYLA AGSTKTGTVA TFGGIKIPTV TIFMDGYADG 
VKYYNEQKGK DVKILGWDKA KQDGSFTGDF EKQDKGKQLT QNFLDQGADI VMPVAGPVGK 
GAGAALKEAK AAGKDVKLIW VDSDGFLTAP DYKDIMLSSV MKQMGEAVET VVKEDKDGKF 
SNTPYVGTLA NDGVQLAPFH DLESQVPAEL KTELEQIKKD IVDGKLKVES AASPKA