Gene Daro_3478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3478
Symbol
ID	3566938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3726071
End bp	3727591
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	60%
IMG OID	637681950
Product	hypothetical protein
Protein accession	YP_286677
Protein GI	71909090
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.153576
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGAGA CTTCATGCCC CCCAGCCACC AGCACTTTGC TCGCTCCTAA AAAAATGGGC 
ATGAGCTTAC CAACCAGGCC ACCAGGCCAG ATCGGCACGC TGCTGGCCCT GTTCATCGCC 
GTCCTTGCCT GGCGGGCGAT TGCCTTTTCG TTATCGAACG CGACCTTGTA TGTGGACGAA 
GCGCAATACT GGTTCTGGTC GCAACATCTG GCGTGGGGCT ATTTTTCCAA GCCACCGGGC 
ATCGCCGCCC TGATTCATCT GTCGACGGCA CTGTTTGGCG ATGGCCCGCT CGGCGTCAAG 
GCGCTGACCA TGCTGTGCTA TCCGTTGAGT GCGCTGATCT GTTGGCTGAT CGCCCAGCAC 
CTCTACGACG CCTCGACTGC TTTCTGGGCT GCCATCGCCG CACTCACGCT GCCCATCTAT 
TCCTGGCTTG GCCTGTTCGC TTCGACTGAT GCGCCATTGA CGTTACTCTG GCTGCTCGGC 
CTGTGGTTTT ATCTGCGCGC CATTGAACAT GGACGCTGGA TGGATTGGCT GATGCTTGGC 
GCGGCCTGCG GATTGGGATT GCTGTCGAAA TACACGATGG CAGTATTCAT CGCTGCGCTC 
TTCCTGCACC TGCTCTGCTT TCACCGCACT TTCCTGACCA GCGCCAAGCC CTGGGCGGCT 
GCCGGACTGA GCCTGGCATT GCTTGCGCCC AACCTGCTCT GGAACCTTGC CAACGATTTC 
CCAACACTTC GCCATACCGC CGATATCACG CTGAATCGCC ACAACGGCGG TGGCTTGAAA 
TCGCTGGCGG AGTTCTGGGC GGCCCAATGG ATCAGCTTCG GACCGCTACT CGGCAGTGTC 
GTCGCACTGA TCCTGTTCCG TTTTCGCGAG ACCTGGCGCG ACACACCAGC CCGCCTGCTG 
CTCTGGTTCT CGCTGCCGCT GTGGGCCGTC GTCTCGGTGC AGGCGCTTCA AGGCAGCGCC 
AACGCCAACT GGGCGGCACC CGCATTCGGG CCGATGGCCA TCCTGCTGGT CGCCTGGTTA 
CGCCAGCGCG ACCAGCACAA ATGGCTATTG ACCGGGGTCG CCACCAACTT CGCCCTCATC 
GGCGTGATCT ACCACGCCCC CGGCCTGCTG GCAGCCGCCA ATGTAAGCAG CCAGGCGAAA 
CTGAACCCGT TTATTCGTGC AACTGGCTGG GATGAGCTCG GACAGCAGCT TCGCCCCCTC 
GTACAGACCC ACCCCAATGC CGTGCTGATC GCGAACAACC GCACGCTGCT CGCGCACATG 
GCTTACGAAC TGCATGGCCA GCAGCCGCGC ATTGCCAGCT GGAACCCGGA AGGCGTGGCC 
AGCGACCACT TCAAATTGAC GATGAAGCTC GACGCTCACC GTGGCGGCGA TGCGCTGTTG 
CTGACCGAGG CTGCACCAGA CCAGGAATTC ACCGAAAGGT TCACGCACGT CGAAAAGCTG 
GCCTCGCTGG CAGCGCCACT CGACACAATC AATTCACGCC ATATCGAGGT TTATTTACTC 
CATGAATTCC AGGGATATTG A

Protein sequence

MFETSCPPAT STLLAPKKMG MSLPTRPPGQ IGTLLALFIA VLAWRAIAFS LSNATLYVDE 
AQYWFWSQHL AWGYFSKPPG IAALIHLSTA LFGDGPLGVK ALTMLCYPLS ALICWLIAQH 
LYDASTAFWA AIAALTLPIY SWLGLFASTD APLTLLWLLG LWFYLRAIEH GRWMDWLMLG 
AACGLGLLSK YTMAVFIAAL FLHLLCFHRT FLTSAKPWAA AGLSLALLAP NLLWNLANDF 
PTLRHTADIT LNRHNGGGLK SLAEFWAAQW ISFGPLLGSV VALILFRFRE TWRDTPARLL 
LWFSLPLWAV VSVQALQGSA NANWAAPAFG PMAILLVAWL RQRDQHKWLL TGVATNFALI 
GVIYHAPGLL AAANVSSQAK LNPFIRATGW DELGQQLRPL VQTHPNAVLI ANNRTLLAHM 
AYELHGQQPR IASWNPEGVA SDHFKLTMKL DAHRGGDALL LTEAAPDQEF TERFTHVEKL 
ASLAAPLDTI NSRHIEVYLL HEFQGY