Gene Arth_2642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2642
Symbol
ID	4444729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2962496
End bp	2963566
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	64%
IMG OID	639690462
Product	hypothetical protein
Protein accession	YP_832121
Protein GI	116671188
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACT GGGTAGGAAT TATCTGGCTG GTGCTCCTGC TGATCGGAAA CGCCTTCTTC 
GTGGCTGCGG AATTCGCGGT GATGTCCGCG CGGCGGAGCC AGATTGAGCC GCTGGCCGAA 
GCAGGGTCCC TGCGGGCCCA GACAACGTTG CGGGCCATGG AAAGCGTGTC CCTCATGCTC 
GCGTGCGCCC AGCTGGGCAT CACGGTCTGC TCCCTGCTGA TCCTGCAGGT GGCTGAGCCG 
GCCATCCACC ACCTGATGGC CGTGCCGCTG GAAGCCGTGG GCGTGCCGAC GGAACTCGCG 
GACGTTGTGG CGTTCGCCGT GGCGCTCCTG GCGGTGACCT TCCTTCACGT GACCTTCGGC 
GAGATGGTGC CCAAGAACAT CTCGGTCTCC GTCGCGGACA AGGCGGCACT GCTGCTGGCG 
CCGCCGCTGA TGTTCATCGC ACGCCTTGTG AACCCGGTGA TCGTGGCCCT CAACTGGTCT 
GCCAACCACA TCCTGCGCCT GCTCCGGATC GAGCCCAAGG ACGAGGTCAA CTCCTCGTTC 
ACCCTGGAGG AGGTCCAGTC CATCGTGCAG GAATCCACCC GGCATGGACT CGTGGATGAC 
GACGCCGGCC TCATCACCGG TGCACTGGAA TTCTCCGAGC ACACGGCGTC CCGCATCATG 
GTTCCGCTGG ACAAGCTGGT CATGATGCAG TCGCCCACCA CGCCGGTGGA GTTTGAAAAA 
GCCGTCAGCC GCACGGGGTT CTCCCGGTTC CCGATGATGG ACGAGGACGG GATGCTTTCG 
GGCTACCTTC ACATCAAGGA TGTGCTGTCC ATCCCGGAAG CCGGATATGA GCACCCGATT 
GCGGAAAGCC GCATCAGGTC CCTGGCGAAC CTGTCCATGG ATGACGAGAT CGAGAAGGCG 
ATGTCCGTGA TGCAACGCAC CGGCTCGCAC CTGGCGCGCG TCATCGGACC GGACGGCAAC 
ACCAGGGGCG TCCTTTTCCT GGAAGACGTG ATCGAACAGC TCGTGGGCGA GATCCGTGAC 
GCCACCCAGG CGAAGGGAAT CCGCCGGCTC GGCCAGCGGA ACGGCGACTA G

Protein sequence

MSDWVGIIWL VLLLIGNAFF VAAEFAVMSA RRSQIEPLAE AGSLRAQTTL RAMESVSLML 
ACAQLGITVC SLLILQVAEP AIHHLMAVPL EAVGVPTELA DVVAFAVALL AVTFLHVTFG 
EMVPKNISVS VADKAALLLA PPLMFIARLV NPVIVALNWS ANHILRLLRI EPKDEVNSSF 
TLEEVQSIVQ ESTRHGLVDD DAGLITGALE FSEHTASRIM VPLDKLVMMQ SPTTPVEFEK 
AVSRTGFSRF PMMDEDGMLS GYLHIKDVLS IPEAGYEHPI AESRIRSLAN LSMDDEIEKA 
MSVMQRTGSH LARVIGPDGN TRGVLFLEDV IEQLVGEIRD ATQAKGIRRL GQRNGD